يُزعم أن فريق الذكاء الاصطناعي في NVIDIA قام بجمع مقاطع فيديو من يوتيوب ونيتفليكس دون الحصول على إذن.

في اتجاه مقلق داخل الصناعة، يُزعم أن NVIDIA قد استخرجت كميات كبيرة من المحتوى المحمي بحقوق الطبع والنشر لدعم مبادراتها في تدريب الذكاء الاصطناعي. أفادت سامانثا كول من 404 ميديا يوم الاثنين أن شركة التكنولوجيا، التي تُقدَّر قيمتها بـ 2.4 تريليون دولار، وجهت موظفيها لتنزيل مقاطع الفيديو من منصات مثل يوتيوب ونتفليكس لتغذية مشاريعها التجارية في الذكاء الاصطناعي. تعكس هذه الخطوة عقلية "سرعة التحرك وكسر الحدود" السائدة بين الشركات التقنية المتنافسة على السيطرة في قطاع الذكاء الاصطناعي المتقلب.

تركزت جهود التدريب المزعومة على إنشاء نماذج لقاذف العالم ثلاثي الأبعاد "Omniverse" من NVIDIA، وأنظمة المركبات ذاتية القيادة، وتقنيات "البشر الرقميين". وادعى متحدث باسم الشركة أن أبحاثها تلتزم بقانون حقوق الطبع والنشر، مشيرًا إلى أن قوانين الملكية الفكرية تحمي التعبيرات المحددة فقط، وليس الحقائق أو الأفكار أو البيانات. وقارنوا هذه الممارسة بحق الأفراد في التعلم من مصادر مختلفة لخلق تعبيرات جديدة.

ومع ذلك، تختلف يوتيوب في الرأي. وقد أشار المتحدث جاك مالون إلى مقال سابق في "بلومبرغ" في أبريل، حيث صرح الرئيس التنفيذي نيل موهان بأن استخدام مقاطع الفيديو على يوتيوب لتدريب الذكاء الاصطناعي ينتهك بوضوح شروط الخدمة الخاصة بالمنصة. هذه التصريحات جاءت بعد جدل سابق حول تدريب OpenAI لنظام "سورا" لتحويل النص إلى فيديو باستخدام محتوى يوتيوب دون إذن. وأفادت تقارير حديثة أن Runway AI كانت تمارس ممارسات مشابهة.

موظفو NVIDIA الذين أعربوا عن مخاوف أخلاقية وقانونية أُبلغوا من قبل الإدارة أن المبادرة قد تمت الموافقة عليها من أعلى المستويات في الشركة. وأكدت مينغ-يو ليو، نائبة رئيس الأبحاث، أن “هذا قرار تنفيذي” وشددت على أن لديهم "موافقة شاملة لجميع البيانات". ووصف آخرون داخل الشركة الممارسة بأنها "مسألة قانونية مفتوحة" تحتاج إلى معالجة لاحقًا.

تشبه هذه الوضعية الشعار القديم لشركة فيسبوك (ميتا)، التي ازدهرت أيضًا على كسر الحدود، لا سيما في خصوصية المستخدمين. بالإضافة إلى المحتوى من يوتيوب ونتفليكس، زُعم أن NVIDIA قد وجهت موظفيها لتدريب على مجموعات بيانات مثل MovieNet ومكتبات الألعاب الداخلية ومستودعات GitHub مثل WebVid (التي أُزيلت بعد إنذار بالامتثال) وInternVid-10M، التي تحتوي على 10 ملايين معرف لمقاطع فيديو على يوتيوب.

بعض المحتوى الذي زُعم أن NVIDIA استخدمته كان مخصصًا للاستخدام الأكاديمي أو غير التجاري فقط. على سبيل المثال، تشمل مكتبة HD-VG-130M المكونة من 130 مليون فيديو على يوتيوب رخصة استخدام تحددها للأبحاث الأكاديمية. ورغم ذلك، يبدو أن NVIDIA قد تجاهلت المخاوف المتعلقة بهذه الشروط الأكاديمية فقط، مدعية أن البيانات كانت متاحة لمشاريعها التجارية في الذكاء الاصطناعي.

لتجنب الكشف من قبل يوتيوب، زُعم أن NVIDIA استخدمت آلات افتراضية (VMs) مع عناوين IP متغيرة لتنزيل المحتويات. عندما اقترح أحد الموظفين استخدام أداة لتدوير عناوين IP من طرف ثالث، رد آخر بأن "إعادة تشغيل مثيل الآلة الافتراضية يعطي IP عام جديد"، مما يشير إلى أن الكشف لم يكن مشكلة.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles