أُتُّهمت شركات Apple وNVIDIA وAnthropic باستخدام غير المصرح به لنصوص YouTube في تدريب نماذج الذكاء الصناعي.

أظهر استطلاع حديث أجرته Proof News أن العديد من شركات التكنولوجيا الكبرى حول العالم استخدمت مجموعة بيانات تضم أكثر من 173,000 نص من مقاطع فيديو يوتيوب دون الحصول على إذن، لتدريب نماذج الذكاء الاصطناعي الخاصة بها. تم إنشاء هذه المجموعة من البيانات من قبل منظمة EleutherAI غير الربحية، وتحتوي على نصوص من أكثر من 48,000 قناة، حيث كانت شركات مثل Apple وNVIDIA وAnthropic من بين المستفيدين منها. تسلط هذه التحقيقات الضوء على قضية مهمة: إذ تم استخدام العديد من مجموعات البيانات الأساسية لتقنيات الذكاء الاصطناعي دون موافقة أو تعويض عادل لمبدعي المحتوى.

على الرغم من أن مجموعة البيانات لا تحتوي على مقاطع الفيديو أو الصور الفعلية من يوتيوب، إلا أنها تضم نصوصًا من مبدعين معروفين مثل Marques Brownlee وMrBeast، بالإضافة إلى محتوى من مؤسسات إعلامية كبرى مثل The New York Times وBBC وABC News. كما تم تضمين محتوى Engadget.

عبّر Marques Brownlee عن قلقه عبر منصة التواصل الاجتماعي X، حيث قال: "تقوم Apple بالحصول على بيانات الذكاء الاصطناعي من شركات متعددة، بما في ذلك كمية كبيرة من النصوص المستخرجة من مقاطع فيديو يوتيوب، بما في ذلك مقاطع الفيديو الخاصة بي". وأكد: "كانت هذه القضية قائمة منذ فترة طويلة".

أعاد متحدث باسم Google التأكيد لـ Engadget أن تصريحات الرئيس التنفيذي ليوتيوب Neal Mohan لا تزال ذات صلة؛ حيث إن استخدام بيانات يوتيوب لتدريب نماذج الذكاء الاصطناعي يعد انتهاكًا لشروط الخدمة الخاصة بالمنصة. ولم ترد أي من Apple أو NVIDIA أو Anthropic أو EleutherAI على استفسارات Engadget.

تظل قلة الشفافية حول البيانات المستخدمة من قبل شركات الذكاء الاصطناعي لتدريب نماذجها مصدر قلق كبير. مؤخراً، انتقد الفنانون والمصورون Apple لعدم إ disclosure مصادر بيانات التدريب الخاصة بتكنولوجيا الذكاء الاصطناعي الجديدة، Apple Intelligence، التي من المقرر تطبيقها عبر ملايين من أجهزة Apple.

باعتبارها أكبر منصة فيديو على الإنترنت، يقدم يوتيوب بيانات النصوص فحسب، بل وأيضًا المحتوى السمعي والبصري، مما يجعله موردًا لا يقدر بثمن لتدريب الذكاء الاصطناعي. في وقت سابق من هذا العام، تجنبت Mira Murati، المديرة التقنية في OpenAI، الإجابة عن أسئلة في مقابلة مع Wall Street Journal حول ما إذا كانت مقاطع فيديو يوتيوب قد استخدمت في تدريب أداة الذكاء الاصطناعي الخاصة بالشركة، Sora، مصممة على أن البيانات المستخدمة كانت متاحة للجمهور أو مرخصة. كما ذكر Sundar Pichai، المدير التنفيذي لشركة Alphabet، أن تدريب نماذج الذكاء الاصطناعي باستخدام بيانات يوتيوب سيخالف شروط خدمة المنصة.

للتحقق مما إذا كان نص فيديو أو قناة معينة مدرجًا في مجموعة البيانات المذكورة أعلاه، يرجى زيارة أداة الاستعلام الخاصة بـ Proof News.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles