استقرار AI يعلن عن SVD 1.1: النموذج الانتشاري الذي يعزز التناسق في إنتاج الفيديو بالذكاء الاصطناعي

ستابيليتي إيه آي تكشف النقاب عن SVD 1.1: خطوة جديدة في توليد الفيديو باستخدام الذكاء الاصطناعي

أعلنت ستابيليتي إيه آي، المشهورة بتوسيع مجموعة نماذجها مفتوحة المصدر للذكاء الاصطناعي في إنشاء المحتوى والترميز، عن تحديث لنموذجها لتوليد الفيديوهات المُعتمد على طور الانتشار الكامن للصور، المعروف باسم Stable Video Diffusion (SVD).

تقديم SVD 1.1

النسخة الجديدة، SVD 1.1، هي تحسين مُصاغ لنسخة SVD 1.0، مُعدّة لتوليد فيديوهات قصيرة باستخدام الذكاء الاصطناعي مع حركة محسّنة واتساق أفضل. وأكد توم ميسون، رئيس قسم التكنولوجيا في ستابيليتي إيه آي، أن SVD 1.1 متاح الآن للتنزيل بشكل علني عبر Hugging Face. بالإضافة إلى ذلك، سيتم تضمينه في اشتراكات ستابيليتي إيه آي، التي تتفاوت في فئات للأفراد والشركات، بدءًا من الاشتراك المجاني إلى 20 دولارًا شهريًا. سيحتاج المستخدمون التجاريون إلى اشتراك للنشر، بينما يبقى الاستخدام البحثي مجانيًا ومفتوحًا.

ميزات محسّنة في SVD 1.1

تم إطلاق SVD 1.1 في نوفمبر 2023، حيث قدمت ستابيليتي إيه آي في البداية نموذجين لتوليد الفيديو باستخدام الذكاء الاصطناعي: SVD، الذي أنشأ فيديوهات لمدة أربع ثوانٍ تصل إلى 14 إطارًا من صورة ثابتة، وSVD-XT، وهو إصدار مُحسّن يُنتج حتى 25 إطارًا. بناءً على SVD-XT، تقوم النسخة الجديدة SVD 1.1 أيضًا بتوليد فيديوهات بأربع ثوانٍ مع 25 إطارًا بدقة 1024×576 عند تقديم إطار سياقي بنفس الحجم.

تهدف هذه الترقية بشكل أساسي إلى تحقيق اتساق أكبر في ناتج الفيديو مقارنةً بالإصدارات السابقة. عانت النماذج السابقة أحيانًا من صعوبات في التصوير الواقعي، ونقص الحركة، وتحديات في توليد وجوه وأشخاص واقعيين. تسعى SVD 1.1 لحل هذه المشكلات، متعهدة بتحسين ديناميكيات الحركة في النواتج النهائية.

وفقًا للشركة، "تمت عملية التحسين لـ SVD 1.1 باستخدام ضبط ثابت عند 6 إطارات في الثانية وID دلو الحركة 127 لتعزيز اتساق النواتج دون الحاجة لتعديلات في المعلمات الفائقة." وعلى الرغم من إمكانية تعديل هذه الإعدادات، قد يختلف الأداء خارج هذه الظروف الثابتة.

الأداء وآفاق المستقبل

على الرغم من تأكيد ستابيليتي إيه آي على التحسينات مع SVD 1.1، يبقى فعالية هذه النسخة في العالم الواقعي محل تقييم. تؤكد صفحة Hugging Face الخاصة بالنموذج تصميمه الموجه للأبحاث وتُقر بأن بعض التحديات من الإصدارات السابقة قد تظل قائمة.

بالإضافة إلى Hugging Face، تتوفر نماذج Stable Video Diffusion عبر واجهة برمجة التطبيقات (API) على منصة مطوري ستابيليتي إيه آي، مما يمكّن المطورين من دمج قدرات توليد الفيديو المتقدمة بسلاسة في تطبيقاتهم. تقوم واجهة Stable Video Diffusion API بتوليد أربع ثوانٍ من الفيديو بسرعة 24 إطارًا في الثانية بصيغة MP4، مما ينتج 25 إطارًا مُنشأً بالإضافة إلى إطارات مُعالجة. ميزات مثل التحكم في قوة الحركة ودعم تخطيطات متعددة ودقات مختلفة، تشمل 1024×576 و768×768 و576×1024، تعزز من سهولة الاستخدام.

نظرة نحو المستقبل

في عام 2023، حققت ستابيليتي إيه آي خطوات هامة في مجال الذكاء الاصطناعي التوليدي مع تحديثات نموذجية متكررة، وهي اتجاه يبدو أنه سيستمر حتى عام 2024. تأسست الشركة في عام 2019، وقد جذبت استثمارات كبيرة، منها جولة تمويلية بقيمة 101 مليون دولار في عام 2022. ومع ذلك، تواجه تنافسًا من لاعبين آخرين في مجال توليد الفيديو باستخدام الذكاء الاصطناعي، مثل Runway وPika، اللذان يكتسبان زخمًا مع منصات ويب سهلة الاستخدام تقدم أيضًا تخصيص الفيديو وترقيته.

مؤخراً، قدمت Runway ميزة Multi Motion Brush، مما يتيح للمستخدمين تحريك مناطق محددة من فيديوهاتهم المُنتجة باستخدام الذكاء الاصطناعي. بالمثل، يسمح Pika للمستخدمين بتحرير مناطق معينة في الفيديوهات، مثل تحويل وجه بقرة إلى وجه بطة. ومع ذلك، لا تُشغل أي منهما واجهات برمجة التطبيقات لنماذجها، مما يقيّد الدمج في التطبيقات الخارجية.

بينما يستمر مشهد توليد الفيديو باستخدام الذكاء الاصطناعي في التطور، تمثل SVD 1.1 من ستابيليتي إيه آي تقدمًا مثيرًا يستحق المتابعة.

Most people like

Find AI tools in YBX