توافر تقنية Stable Video Diffusion الآن عبر واجهة برمجة التطبيقات من Stability AI لتسهيل إنشاء مقاطع الفيديو بشكل أفضل.

أطلقت Stability AI، المعروفة بمولد الصور من النصوص Stable Diffusion، نموذجها الأساسي الجديد Stable Video Diffusion (SVD). أصبح هذا النموذج متاحًا الآن عبر منصة المطورين وواجهة برمجة التطبيقات (API) الخاصة بالشركة، مما يتيح للمطورين من جهات خارجية دمجه في تطبيقاتهم ومواقعهم وحلولهم البرمجية.

وقالت الشركة في منشور على مدونتها: "توفر هذه الإضافة الجديدة وصولًا برمجيًا لنموذج فيديو متطور مصمم لمختلف القطاعات. هدفنا هو تمكين المطورين من دمج توليد الفيديو المتقدم بكفاءة في منتجاتهم".

بينما توفر هذه الإضافة أداة قوية للشركات الراغبة في إنتاج مقاطع فيديو مولدة بواسطة الذكاء الاصطناعي، إلا أنها تثير أيضًا بعض المخاوف. تم توجيه انتقادات مؤخرًا إلى Stability AI لاستخدامها مجموعة بيانات LAION-5B، التي تحتوي على مواد غير مناسبة وتم سحبها من التداول لاحقًا.

على الرغم من هذه التحديات، يقدم API الخاص بـ SVD لمسة تنافسية في جودة الفيديو. وفقًا لمنشور على LinkedIn من الشركة، يمكن لنموذج SVD إنتاج فيديو مدته 2 ثانية، بما في ذلك 25 إطارًا مولدًا و24 إطارًا من التداخل، خلال 41 ثانية فقط. وعلى الرغم من أن هذه المدة قد لا تكفي للحملات الإعلانية الكبيرة، إلا أنها مفيدة لإنشاء GIFs ورسائل محددة، بما في ذلك الميمز.

يتنافس SVD مع نماذج توليد الفيديو الأخرى من Runway وPika Labs، التي حصلت مؤخرًا على 55 مليون دولار في جولة تمويل وأطلقت منصة جديدة لتحرير الفيديو. ومع ذلك، على عكس Stability AI، فإن هذه الخيارات غير متاحة عبر API، مما يتطلب من المستخدمين الوصول إليها مباشرة على مواقعهم أو تطبيقاتهم الخاصة.

علاوة على ذلك، تخطط Stability AI لإطلاق تجربة ويب موجهة للمستخدمين لمولد الفيديو الخاص بها، مما يشجع المستخدمين على الانضمام إلى قائمة الانتظار للوصول المبكر.

فهم Stable Video Diffusion

تم تقديم Stable Video Diffusion في عرض بحثي قبل شهر، مما يتيح للمستخدمين إنشاء مقاطع فيديو MP4 من صور ثابتة مثل JPGs وPNGs. تُظهر العينات الأولية أنه على الرغم من قدرة النموذج على إنتاج مقاطع قصيرة تصل مدتها إلى ثانيتين، إلا أنه لا يزال في مراحل التطوير ويقدم مدة أقل مقارنة ببعض النماذج المخصصة للبحث.

ومع ذلك، يمكن دمج مقاطع قصيرة متعددة لإنتاج مقاطع فيديو أطول. وتدعي Stability AI أن النموذج يمكن أن يكون مفيدًا في مجالات مثل الإعلان والتسويق والتلفزيون والسينما والألعاب.

من المهم أن النموذج الأخير قادر على توليد مقاطع فيديو بتنسيقات ودقات متعددة، بما في ذلك 1024×576 و768×768 و576×1024. كما يحتوي على التحكم في قوة الحركة وتوليد المعطيات على أساس البذور، مما يسمح بإنتاج نتائج قابلة للتكرار وعشوائية.

التنقل في الجدل

بينما يوفر إطلاق Stable Video Diffusion طريقة سهلة للشركات لدمج قدرات الفيديو، فإنه يبرز التزام Stability AI بتأمين مكانتها في السوق وسط الجدل المستمر بخصوص مصادر بيانات تدريبها.

مؤخراً، كشف تقرير من مرصد الإنترنت في ستانفورد أن مجموعة بيانات LAION-5B، المستخدمة لتدريب نماذج الذكاء الاصطناعي الشهيرة، تحتوي على مواد غير مناسبة، مما استدعى سحبها. بالإضافة إلى ذلك، تواجه الشركة دعوى جماعية بشأن استحواذها المزعوم على صور محمية بحقوق الطبع والنشر دون إذن لإنشاء Stable Diffusion.

حالياً، يوفر API الخاص بمنصة المطورين في Stability AI الوصول إلى جميع نماذجها، بما في ذلك مولد الصور من النصوص Stable Diffusion XL والنموذج الجديد SVD. كما تقدم الشركة خيار الاشتراك للعملاء لاستضافة هذه النماذج على خوادمهم المحلية.

Most people like

Find AI tools in YBX