شركة Runway للذكاء الاصطناعي مُتهمة بانتزاع "آلاف" مقاطع الفيديو من يوتيوب وسرقة أفلام محمية بحقوق الطبع والنشر دون الحصول على التصاريح اللازمة. وقد حصلت الوكالة الاستقصائية 404 Media على جداول بيانات داخلية تشير إلى أن شركة إنشاء الفيديوهات بالذكاء الاصطناعي قامت بتدريب نموذجها Gen-3 باستخدام محتوى من قنوات مملوكة لجهات رئيسية مثل ديزني، نيتفليكس، وبيكسار.
كشف موظف سابق في Runway عن أن هذه الجداول كانت تُستخدم لتحديد مقاطع الفيديو لإضافتها إلى قاعدة بيانات الشركة، والتي تم تنزيلها لاحقاً دون كشف باستخدام برامج وكيل مفتوحة المصدر. احتوت إحدى الجداول على كلمات مفتاحية بسيطة مثل "رائد فضاء"، "جنية"، و"قوس قزح"، مع تعليقات حول توافر مقاطع فيديو تدريبية ذات جودة. على سبيل المثال، احتوى الكلمة المفتاحية "بطل خارق" على ملاحظة تفيد بوجود "الكثير من مقاطع الأفلام". كانت هناك ملاحظات أخرى تشير إلى أن القنوات التي تركز على Unreal Engine، وصانع الأفلام جوش نيومان، وصفحة معجبي Call of Duty كانت مصادر ممتازة لمقاطع الفيديو ذات الحركة العالية.
قال الموظف السابق: "تمثل القنوات في تلك الجداول جهدًا على مستوى الشركة لاكتشاف مقاطع الفيديو ذات الجودة العالية لتطوير النموذج". وأضاف: "هذا أدى إلى إنشاء زاحف ضخم قام بتنزيل مقاطع الفيديو من جميع القنوات المدرجة، باستخدام بروكسي لتفادي الكشف عن طريق جوجل".
تضمنت الجداول ما يقرب من 4,000 قناة على يوتيوب تم تصنيفها على أنها "موصى بها"، وكانت تضم محتوى من CBS New York، AMC Theaters، بيكسار، Disney Plus، وحتى حوض مائية Monterey Bay. وفقاً للتقارير، قامت Runway أيضًا بتجميع قائمة منفصلة من مقاطع الفيديو من مواقع القرصنة، حيث قدمت جدول بيانات بعنوان "مصدر غير يوتيوب" روابط لأرشيفات غير مصرح بها لأفلام استوديو غيبلي ومنصات قرصنة للأنمي والأفلام.
لإثبات ادعاءات الاستخدام غير المصرح به للبيانات، اكتشفت 404 Media أن إدخال أسماء يوتيوبرز مشهورين مدرجة في الجدول أسفر عن نتائج متطابقة بشكل ملحوظ. بينما أدى استخدام نفس الأسماء مع نموذج Runway القديم Gen-2 - المدرب على بيانات مختلفة - إلى نتائج غير ذات صلة، مثل صور عامة لرجال يرتدون بدلات. ومن المثير للاهتمام، أنه بعد استفسار 404 Media حول تشابه الأشخاص في النتائج، توقفت الأداة الذكية عن إنتاج هذه الشبهات تمامًا.
قال الموظف السابق: "آمل أن يساعد مشاركة هذه المعلومات الناس على فهم مدى مدى تأثير هذه الشركات وطرقها في إنتاج مقاطع الفيديو 'البارعة'".
عند الاتصال للتعليق، أشار تمثيل يوتيوب إلى مقابلة في أبريل مع الرئيس التنفيذي نيل موهان، الذي اعتبر أن التدريب على مقاطع الفيديو الخاصة بهم هو "انتهاك واضح" لشروط يوتيوب. قال: "تظل تعليقاتنا السابقة على هذا الموضوع قائمة". ولم تستجب Runway لطلب التعليق قبل موعد نشر المقال.
بينما يستمر تطور مشهد الذكاء الاصطناعي، قد تسعى بعض الشركات إلى تأسيس هيمنتها في السوق قبل أن يفهم المستهلكون والأنظمة القانونية تمامًا تداعيات ممارساتها. في حين أن التدريب بإذن من خلال اتفاقيات مرخصة هو نهج يتبعه شركات مثل OpenAI، فإن انتزاع المحتوى من الإنترنت المحمي بحقوق الطبع والنشر يمثل استراتيجية أكثر جدلاً، إن لم تكن غير قانونية، في السباق من أجل الربح والتفوق التكنولوجي.