مؤخراً، استضافت قناة WVFRM Podcast لقاءً مع الفريق الأساسي وراء Sora، نموذج توليد الفيديو المبتكر الذي طورته OpenAI. في النقاش، شارك القادة في المشروع، بيل بيبلز، تيم بروكس، وأديتيا راميش، رؤاهم حول الوضع الحالي لـ Sora واتجاهه المستقبلي. وأكدوا أن Sora لا يزال في مرحلة جمع ملاحظات المستخدمين ولم يصل بعد إلى مرحلة المنتج الكامل. ولذلك، لن يكون متاحاً للجمهور في المدى القريب، ولا توجد خطة زمنية محددة لتطوره إلى عرض كامل.
عند شرح كيفية عمل Sora، أشار الفريق إلى أنه يقوم بتحليل كميات هائلة من بيانات الفيديو ليتعلم كيفية إنشاء مقاطع فيديو واقعية. تدمج التكنولوجيا بين قدرات النماذج اللغوية الكبيرة، مثل GPT، ونماذج الانتشار مثل DALL-E. بينما هيكل Sora يشبه إلى حد ما GPT، فإن تقنيات تدريبه تقترب من تلك المستخدمة في DALL-E.
فيما يتعلق بمصادر بيانات تدريب Sora، كان بإمكان الفريق فقط الكشف عن أنه يستخدم مزيجاً من مجموعات البيانات المتاحة للجمهور وتلك المصرح بها من OpenAI. على الرغم من وجود تقارير تفيد بأن Sora يمكنه إنشاء مقاطع فيديو ذات جودة نسبية من نصوص بسرعة، لا يزال الخبراء في الصناعة يشيرون إلى قيود أدوات الذكاء الاصطناعي الحالية، التي لا يمكنها استبدال عمل المبدعين البشريين بشكل كامل.
علق ك artist تصميم الأفلام ريد ساوثن قائلاً: "يعتقد الكثيرون أن هوليوود تقترب من نهايتها، لكن لدي وجهة نظر مختلفة. عمليات الإنتاج في هوليوود معقدة، وهذه الفيديوهات المُولدة لا تزال تواجه العديد من التحديات، لا سيما فيما يتعلق بالتناسق الزمني وغيرها من التفاصيل."