بررسیهای اخیر نشان میدهد که بیش از ۱۷۰ هزار ویدیوی یوتوب بدون اجازه از این پلتفرم استخراج و برای آموزش مدلهای هوش مصنوعی توسط شرکتهای بزرگی مانند اپل، انتروپیک، انویدیا و سیلزفورس استفاده شدهاند.
این اقدام، نقض قوانین خدمات یوتوب محسوب میشود و سؤالات زیادی درباره شفافیت استفاده از دادهها توسط شرکتهای هوش مصنوعی به وجود آورده است.
استفاده بدون اجازه از بیش از ۱۷۰ هزار ویدیوی یوتوب در آموزش هوش مصنوعی
بیش از ۱۷۰ هزار ویدیوی یوتوب بخشی از یک مجموعه داده عظیم هستند که برای آموزش هوش مصنوعی برخی از بزرگترین شرکتهای فناوری استفاده شده است. براساس تحقیقاتی که توسط Proof News با همکاری Wired منتشر شده است، اپل، انتروپیک، انویدیا و سیلزفورس از دادههای زیرنویس ویدیوهای یوتوب استفاده کردهاند. این کار بدون اجازه انجام شده است. این مجموعه داده شامل زیرنویس ویدیوهای بیش از ۴۸ هزار کانال است و تصاویر ویدیوها را شامل نمیشود.
ویدیوهای یوتوبرهای محبوبی مانند MrBeast و MKBHD در این مجموعه داده وجود دارند. همچنین دادههای کلیپهایی از برخی رسانهها مانند ABC News ،BBC و نیویورکتایمز نیز در آن موجود است.
گفته میشود اپل دادههای مورد نیاز برای آموزش هوش مصنوعی خود را از چندین شرکت تهیه کرده است. یکی از آنها حجم زیادی از دادههای ویدیوهای یوتوب را استخراج کرده است.
سال گذشته میلادی نیز، تحلیل یکی از مجموعه دادهها به نام Books3 نشان داد که از آثار کدام نویسندگان برای آموزش هوش مصنوعی استفاده شده است.
شرکتهای توسعهدهنده هوش مصنوعی معمولاً در مورد دادههایی که برای آموزش مدلهای خود استفاده میکنند شفافیت لازم را ندارند. در ماه مارس و هنگامی که OpenAI ابزار تولید ویدیو قدرتمند خود یعنی Sora را معرفی کرد، «میرا موراتی» از پاسخ به سؤالاتی در مورد اینکه آیا این سیستم از ویدیوهای یوتوب برای آموزش استفاده میشوند یا خیر، طفره رفت.
<دیجیاتو / منبع