بررسی‌های اخیر نشان می‌دهد که بیش از ۱۷۰ هزار ویدیوی یوتوب بدون اجازه از این پلتفرم استخراج و برای آموزش مدل‌های هوش مصنوعی توسط شرکت‌های بزرگی مانند اپل، انتروپیک، انویدیا و سیلزفورس استفاده شده‌اند.

این اقدام، نقض قوانین خدمات یوتوب محسوب می‌شود و سؤالات زیادی درباره شفافیت استفاده از داده‌ها توسط شرکت‌های هوش مصنوعی به وجود آورده است.

استفاده بدون اجازه از بیش از ۱۷۰ هزار ویدیوی یوتوب در آموزش هوش مصنوعی

بیش از ۱۷۰ هزار ویدیوی یوتوب بخشی از یک مجموعه داده عظیم هستند که برای آموزش هوش مصنوعی برخی از بزرگ‌ترین شرکت‌های فناوری استفاده شده است. براساس تحقیقاتی که توسط Proof News با همکاری Wired منتشر شده است، اپل، انتروپیک، انویدیا و سیلزفورس از داده‌های زیرنویس ویدیوهای یوتوب استفاده کرده‌اند. این کار بدون اجازه انجام شده است. این مجموعه داده شامل زیرنویس‌ ویدیوهای بیش از ۴۸ هزار کانال است و تصاویر ویدیوها را شامل نمی‌شود.

ویدیوهای یوتوبرهای محبوبی مانند MrBeast و MKBHD در این مجموعه داده وجود دارند. همچنین داده‌های کلیپ‌هایی از برخی رسانه‌ها مانند ABC News ،BBC و نیویورک‌‌تایمز نیز در آن موجود است.

گفته می‌شود اپل داده‌های مورد نیاز برای آموزش هوش مصنوعی خود را از چندین شرکت تهیه کرده است. یکی از آن‌ها حجم زیادی از داده‌های ویدیوهای یوتوب را استخراج کرده است.

سال گذشته میلادی نیز، تحلیل یکی از مجموعه داده‌ها به نام Books3 نشان داد که از آثار کدام نویسندگان برای آموزش هوش مصنوعی استفاده شده است.

شرکت‌های توسعه‌دهنده هوش مصنوعی معمولاً در مورد داده‌هایی که برای آموزش مدل‌های خود استفاده می‌کنند شفافیت لازم را ندارند. در ماه مارس و هنگامی که OpenAI ابزار تولید ویدیو قدرتمند خود یعنی Sora را معرفی کرد، «میرا موراتی» از پاسخ به سؤالاتی در مورد اینکه آیا این سیستم از ویدیوهای یوتوب برای آموزش استفاده می‌شوند یا خیر، طفره رفت.

<دیجیاتو / منبع

ارسال پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *