مؤخراً، أجرى بودكاست WVFRM على يوتيوب مقابلة مع الفريق الأساسي خلف نموذج توليد الفيديو الرائد Sora من OpenAI. قدم قادة المشروع، بيل بيبلز، تيم بروكس، وأديتيا راميش، رؤى حول الوضع الحالي لـ Sora وخططه المستقبلية، مشيرين إلى أنه لا يزال في مرحلة جمع تعليقات المستخدمين وأنه لن يكون متاحًا للجمهور على المدى القصير.
Sora هو نموذج مبتكر لتوليد الفيديو بالذكاء الاصطناعي تم تطويره بواسطة OpenAI، وقد جذب اهتمامًا كبيرًا منذ إصداره. يمكن للنموذج إنشاء فيديوهات واقعية تصل مدتها إلى 60 ثانية بناءً على التعليمات النصية، مما يظهر قدرات استثنائية في محاكاة العالم الفيزيائي. يعمل من خلال تحليل كميات ضخمة من بيانات الفيديو واستغلال تقنيات متطورة من نماذج اللغة الكبيرة مثل GPT ونماذج الانتشار مثل DALL-E لإنتاج محتوى فيديو عالي الجودة.
على الرغم من التقدم التقني الملحوظ، يؤكد الفريق أن Sora لا يزال في مرحلة التطوير وليس منتجًا متكاملاً بعد. يقومون بجمع تعليقات المستخدمين لتحسين النموذج، لكن لم يتم تحديد إطار زمني لإطلاقه في السوق بعد.
عند مناقشة البيانات التدريبية لـ Sora، أوضح الفريق أن النموذج يعتمد على مزيج من البيانات المتاحة للجمهور والبيانات المرخصة من OpenAI، مما يضمن الابتكار والامتثال لمعايير استخدام البيانات.
يلاحظ الخبراء في الصناعة إمكانيات Sora باهتمام، على الرغم من اعترافهم بحدودها. أشار رسام الأفلام ريد ساوثن إلى أنه رغم تقدم أدوات الذكاء الاصطناعي في إنتاج الفيديو، إلا أنها لا يمكن أن تحل بالكامل محل المبدعين البشريين، خصوصًا في العملية المعقدة لصناعة الأفلام، حيث لا تزال أدوات الذكاء الاصطناعي الحالية تواجه صعوبات في عناصر مثل التناسق الزمني والحركات الإضافية.
ومع ذلك، يمثل Sora خطوة كبيرة لـ OpenAI في مجال تكنولوجيا تحويل النص إلى فيديو، وتنتظر التطورات المستقبلية بشغف. مع تطور التكنولوجيا واستمرار الفريق في تحسين النموذج، يعد Sora بتقديم نتائج أكثر إثارة. نتطلع إلى تفاعل الخبراء في الصناعة والهواة في عملية التعليقات والتحسين، مما سيساهم في تقدم هذا المجال المبتكر.