إذا كنت تتابع مؤثرين أو منشئي محتوى الذكاء الاصطناعي على وسائل التواصل الاجتماعي، فقد لاحظت زيادة في الحماس حول نموذج جديد لتوليد الفيديوهات بالذكاء الاصطناعي يسمى "Kling". يقوم Kling بإنشاء فيديوهات واقعية للغاية من النصوص والمعدلات داخل التطبيق، مقارنةً بنموذج OpenAI القائم على الدعوة فقط، Sora. Sora في الوقت الحالي في اختبار مغلق وتم مشاركته بشكل انتقائي مع عدد محدود من الفنانين وصانعي الأفلام لاختباره، خاصة في استكشاف استخداماته المثيرة للجدل.
مؤخراً، عرض Kling قدراته على يوتيوب من خلال تكرار فيديو "air head"، الذي كان من بين الفيديوهات الأولى التي أنشأتها وكالة Shy Kids باستخدام Sora.
ما هو Kling وأصوله؟
وفقاً لصحيفة South China Morning Post، تم تطوير Kling من قِبل Kuaishou Technology، الشركة وراء تطبيق كوايشو، الذي يُعد ثاني أكثر تطبيقات الفيديو القصير شعبية في الصين (يُعرف باسم Kwai خارج الصين) مع 400 مليون مستخدم نشط يوميًا. يأتي في المرتبة الثانية بعد Douyin، النسخة الصينية من TikTok، والتي تضم 600 مليون مستخدم نشط يوميًا. تجعل هذه المشاركة العالية من Kling جذابة بشكل خاص، وقد تعزز من موقف Kuaishou مقابل Douyin.
تشير SCMP إلى أن نموذج Kling الخاص بالذكاء الاصطناعي، الذي هو في مرحلة التجربة، يمكنه تحويل النص إلى مقاطع فيديو تصل مدتها إلى دقيقتين بدقة 1080 بكسل، ويقدم الدعم لأبعاد مختلفة. يمكنه تفسير الإشارات لإنشاء فيديوهات تعكس سيناريوهات واقعية أو مشاهد خيالية.
بحسب مصادر استشهدت بها Perplexity، يستخدم Kling مكوناً فريداً يُعرف باسم 3D Variational Autoencoder (VAE) لإعادة بناء الوجه والجسم، مما يتيح التقاط تعبيرات وحركات مفصلة من صورة جسم كاملة واحدة، ويُدعَّم بآلية انتباه مشترك ثلاثية الأبعاد، مما يمكّن النموذج من معالجة مشاهد معقدة مع الالتزام بقوانين الفيزياء.
كيفية الوصول إلى Kling وتكلفته
Kling مجاني عبر تطبيقات Kuaishou وKwai وKwaiCut (الأخير هو منافس لتحرير الفيديو CapCut الخاص بـ TikTok). ومع ذلك، قد يواجه المستخدمون المحتملون خارج الصين مشكلات في الوصول؛ حيث تشير التقارير إلى أن رقم هاتف صيني مطلوب لتنزيل التطبيق واستخدامه. اقترحت الشريك في رأس المال الاستثماري Justine Moore من a16z حلاً باستخدام رقم هاتف مؤقت عبر تطبيق KwaiCut. كما أوصى صانع الأفلام الأمريكي Dusting Hollywood باستخدام ChatGPT لترجمة قوائم التطبيق وواجهاته لغير الناطقين بالصينية.
قدرات Kling
أفاد المستخدمون الأوائل أن Kling يتفوق في إنشاء فيديوهات غامرة وواقعية بدقة عالية في مختلف الأنواع، بدءًا من مشاهد الأكشن إلى إعادة إنشاء ألعاب الرماية من منظور الشخص الأول، وسيناريوهات الخيال العالي التي تذكرنا بـ House of the Dragon أو Game of Thrones. يشير Dustin Hollywood إلى أن توليد فيديو بناءً على إشارة ذات تعقيد "متوسط" يستغرق حوالي دقيقتين. ومع ذلك، يشير إلى بعض الحدود، خاصة في تصوير العرق ولون البشرة بشكل دقيق، وهو تحدٍ مشابه لتحديات قدرات توليد الصور بالذكاء الاصطناعي من Google.
على الرغم من هذه العيوب، فإن Kling يُحدث ضجة في مجتمع صانعي الأفلام، مما يدفع العديد، بما في ذلك Hollywood، لإعادة النظر في آرائهم حول Sora واستراتيجية توزيع OpenAI الحذرة.
أثر Kling على مشهد الفيديو بالذكاء الاصطناعي
ظهور Kling يطرح تساؤلات حول قدرته على دفع مقدمي نماذج الفيديو بالذكاء الاصطناعي في الولايات المتحدة، مثل OpenAI وRunway وPika، لتعزيز عروضهم من حيث الجودة والدقة. يبقى أن نرى ما إذا كانوا سيتمكنون من التكيف سريعاً لتلبية أو تجاوز ما يقدمه Kling.
لأي شخص مهتم بصناعة الأفلام بالذكاء الاصطناعي أو صناعة السينما بشكل أوسع، يعتبر تقديم Kling تطوراً مثيراً. نتمنى إصداره الكامل في الولايات المتحدة دون القيود الحالية على تحقق رقم الهاتف.