جذبت OpenAI اهتمام مجتمع التكنولوجيا، بالإضافة إلى المحترفين في مجالات الإعلام والفنون، من خلال نموذجها الجديد للذكاء الاصطناعي "سورا". يتميز هذا الابتكار بإنتاج مقاطع فيديو واقعية وعالية الدقة تصل مدتها إلى 60 ثانية، رغم أنه لا يزال غير متاح للجمهور. في فبراير 2024، أعلنت OpenAI أن "سورا" متاحة للاختبار لمجموعة مختارة من الفنانين المرئيين والمصممين وصانعي الأفلام. ومع ذلك، بدأ المستخدمون الأوائل في إنشاء ومشاركة مشاريع باستخدام "سورا".
من بين هؤلاء، الكاتب والمخرج بول تريلو، الذي كان من أوائل من عرضوا مقاطع الفيديو المولدة من "سورا". وقد أنشأ ما يُعتبر "أول فيديو موسيقي رسمي مُصوَّر باستخدام سورا" للفنان المستقل في مجال الشيل ويف "واشد أوت" (إرنست ويذيرلي غرين جونيور) لأغنيته "The Hardest Part". يتميز الفيديو الذي يمتد لأربع دقائق بسلسلة من اللقطات المتصلة السريعة التي تم تجميعها بشكل سلس لتخلق الوهم بتكبير مستمر.
على منصة التواصل الاجتماعي X، كشف تريلو أنه وضع فكرة الفيديو قبل عشرة أعوام ولكنه أهملها. وذكر أن الفيديو النهائي تم عمله من 55 مقطعاً مولداً بواسطة "سورا" من أصل 700، والتي تم تحريرها معاً باستخدام برنامج أدوبي بريمير.
في أخبار ذات صلة، أعلنت أدوبي عن خطط لدمج "سورا" ونماذج أخرى لتوليد الفيديو بواسطة الذكاء الاصطناعي في برنامج بريمير برو. ومع ذلك، لم يتم تأكيد أي جدول زمني لهذا التكامل. ولهذا، فإن أولئك الذين يتطلعون لتكرار آلية عمل تريلو في هذه الأثناء، يحتاجون إلى إنشاء مقاطع الفيديو باستخدام أدوات أخرى مثل "رانواي" أو "بيكا"، حيث أن "سورا" ليست متاحة للجمهور بعد.
في مقابلة مع لوس أنجليس تايمز، أعرب "واشد أوت" عن حماسه لدمج تقنيات جديدة في عمله، معبراً عن رغبته في استكشاف تقنيات مبتكرة. وتفصل المقابلة المحفزات المحددة المستخدمة لتوليد اللقطات، حيث أكد غرين على أهمية تضمين تفاصيل دقيقة عن الصور وزوايا اللقطات وحركات الشخصيات. على سبيل المثال، وصف تريلو إحدى اللقطات بالقول، "نتكبير خلال الفقاعة، وتنفجر، ونتكبير خلال علكة الفقاعة إلى ملعب كرة القدم المفتوح"، مما يعكس الطبيعة الديناميكية والجذابة للفيديو.
كما أشار تريلو إلى أنه استخدم فقط قدرات "سورا" لتحويل النص إلى فيديو، وفضل عدم دمج صور ثابتة مولدة من أماكن أخرى، وهي طريقة شائعة بين الفنانين في عالم الفيديو بالذكاء الاصطناعي المتطور.
ظهور "سورا" يُظهر إمكانيات الذكاء الاصطناعي في خلق وسائل الإعلام، متجاوزاً التقارير التي تفيد بأن المقاطع التجريبية السابقة - مثل "Air Head" من استوديو شاي كيدز الكندي - اعتمدت بشكل كبير على المؤثرات البصرية وأدوات التحرير التقليدية مثل الروتوسكوبينغ في أدوبي أفتر إفكتس. علاوة على ذلك، يبرز الاهتمام المستمر بين المبدعين لاستغلال أدوات الذكاء الاصطناعي في سرد القصص، رغم النقد من بعض الذين يرون أن مثل هذه التقنيات، وخاصة تقنيات OpenAI، تعتبر استغلالية. تبرز المخاوف بشأن استخدام الأعمال السابقة للفنانين في تدريب النماذج دون الحصول على إذن أو تعويض.