أفادت تقارير أن شركتي آبل ونVIDIA وAnthropic استخدموا نصوص يوتيوب لتدريب نماذج الذكاء الاصطناعي دون الحصول على إذن.

أظهرت دراسة أجرتها Proof News أن بعض أكبر شركات التكنولوجيا، مثل Apple وNVIDIA وAnthropic، قامت بتدريب نماذج الذكاء الاصطناعي الخاصة بها باستخدام مجموعة بيانات تتضمن نصوصًا لأكثر من 173,000 مقطع فيديو من يوتيوب - دون الحصول على إذن من صانعي المحتوى. تم تجميع هذه البيانات من قبل منظمة EleutherAI غير الربحية، وتشمل نصوصاً من قنوات تمثل أكثر من 48,000 مُبدِع، بما في ذلك شخصيات بارزة مثل ماركيس براونلي وMrBeast، فضلًا عن مؤسسات إخبارية كبرى مثل نيويورك تايمز وبي بي سي وABC نيوز.

تسلط هذه التحقيقات الضوء على واقع مقلق في تطوير الذكاء الاصطناعي: يعتمد الكثير من التكنولوجيا على بيانات تم استخراجها من صانعي المحتوى دون موافقتهم أو تعويضهم. وعلى الرغم من أن مجموعة البيانات لا تحتوي على مقاطع فيديو أو صور، إلا أنها تحتوى على مساهمات ضخمة من مُبدِعين مؤثرين.

عبر ماركيس براونلي عن مخاوفه على وسائل التواصل الاجتماعي، مشيرًا إلى أن Apple حصلت على بيانات من عدة شركات، واحدة منها سحبت النصوص من مقاطع فيديو يوتيوب، بما في ذلك مقاطع الفيديو الخاصة به. وقال: "ستظل هذه المشكلة تتطور لفترة طويلة"، معترفًا بالتحديات الأخلاقية المعقدة المحيطة باستخدام البيانات في الذكاء الاصطناعي.

كررت المتحدثة باسم Google أن التصريحات التي أدلى بها الرئيس التنفيذي ليوتيوب نيل موهان حول انتهاك الشركات لشروط الخدمة الخاصة بالمنصة لا تزال قائمة. فشلت المحاولات المتكررة للحصول على تعليقات من Apple وNVIDIA وAnthropic وEleutherAI.

تظل الشفافية فيما يتعلق ببيانات التدريب المستخدمة من قبل شركات الذكاء الاصطناعي قضية صعبة. مؤخرًا، واجهت Apple انتقادات من فنانين ومصورين لعدم الكشف عن مصدر بيانات التدريب لميزة الذكاء الاصطناعي التوليدية القادمة، Apple Intelligence. وفي ردها، أوضحت Apple أن نموذج OpenELM، الذي تم إنشاؤه فقط لأغراض البحث، لا يدعم قدرات الذكاء الاصطناعي أو التعلم الآلي الخاصة بها. وقد أكدت الشركة أن نماذجها للذكاء الاصطناعي تم تدريبها على "بيانات مرخصة" ومعلومات متاحة للجمهور تم جمعها بواسطة برامج زحف الويب.

يعتبر يوتيوب، بصفته أكبر مستودع فيديو في العالم، مصدرًا غنيًا بالنصوص والصوت والفيديو والصور، مما يجعله موردًا جذابًا لتطوير نماذج الذكاء الاصطناعي. في وقت سابق من هذا العام، تجنبت المديرة التقنية في OpenAI، ميرا مواتي، الإجابة عن أسئلة حول ما إذا كانت مقاطع الفيديو من يوتيوب قد استخدمت في تدريب أداة توليد الفيديو Sora من OpenAI، مشيرة إلى أن البيانات كانت إما متاحة للجمهور أو مرخصة.

لمن يرغب في التحقق مما إذا كانت العناوين الفرعية من مقاطع الفيديو الخاصة بك أو تلك الخاصة بالقنوات المفضلة لديك مشمولة في مجموعة البيانات هذه، يمكنكم زيارة أداة البحث الخاصة بـ Proof News.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles