استقرار AI يعلن عن SVD 1.1: النموذج الانتشاري الذي يعزز التناسق في إنتاج الفيديو بالذكاء الاصطناعي

Home أخبار الذكاء الاصطناعي استقرار AI يعلن عن SVD 1.1: النموذج الانتشاري الذي يعزز التناسق في إنتاج الفيديو بالذكاء الاصطناعي

Updated on فبراير 6 2024

ستابيليتي إيه آي تكشف النقاب عن SVD 1.1: خطوة جديدة في توليد الفيديو باستخدام الذكاء الاصطناعي

أعلنت ستابيليتي إيه آي، المشهورة بتوسيع مجموعة نماذجها مفتوحة المصدر للذكاء الاصطناعي في إنشاء المحتوى والترميز، عن تحديث لنموذجها لتوليد الفيديوهات المُعتمد على طور الانتشار الكامن للصور، المعروف باسم Stable Video Diffusion (SVD).

تقديم SVD 1.1

النسخة الجديدة، SVD 1.1، هي تحسين مُصاغ لنسخة SVD 1.0، مُعدّة لتوليد فيديوهات قصيرة باستخدام الذكاء الاصطناعي مع حركة محسّنة واتساق أفضل. وأكد توم ميسون، رئيس قسم التكنولوجيا في ستابيليتي إيه آي، أن SVD 1.1 متاح الآن للتنزيل بشكل علني عبر Hugging Face. بالإضافة إلى ذلك، سيتم تضمينه في اشتراكات ستابيليتي إيه آي، التي تتفاوت في فئات للأفراد والشركات، بدءًا من الاشتراك المجاني إلى 20 دولارًا شهريًا. سيحتاج المستخدمون التجاريون إلى اشتراك للنشر، بينما يبقى الاستخدام البحثي مجانيًا ومفتوحًا.

ميزات محسّنة في SVD 1.1

تم إطلاق SVD 1.1 في نوفمبر 2023، حيث قدمت ستابيليتي إيه آي في البداية نموذجين لتوليد الفيديو باستخدام الذكاء الاصطناعي: SVD، الذي أنشأ فيديوهات لمدة أربع ثوانٍ تصل إلى 14 إطارًا من صورة ثابتة، وSVD-XT، وهو إصدار مُحسّن يُنتج حتى 25 إطارًا. بناءً على SVD-XT، تقوم النسخة الجديدة SVD 1.1 أيضًا بتوليد فيديوهات بأربع ثوانٍ مع 25 إطارًا بدقة 1024×576 عند تقديم إطار سياقي بنفس الحجم.

تهدف هذه الترقية بشكل أساسي إلى تحقيق اتساق أكبر في ناتج الفيديو مقارنةً بالإصدارات السابقة. عانت النماذج السابقة أحيانًا من صعوبات في التصوير الواقعي، ونقص الحركة، وتحديات في توليد وجوه وأشخاص واقعيين. تسعى SVD 1.1 لحل هذه المشكلات، متعهدة بتحسين ديناميكيات الحركة في النواتج النهائية.

وفقًا للشركة، "تمت عملية التحسين لـ SVD 1.1 باستخدام ضبط ثابت عند 6 إطارات في الثانية وID دلو الحركة 127 لتعزيز اتساق النواتج دون الحاجة لتعديلات في المعلمات الفائقة." وعلى الرغم من إمكانية تعديل هذه الإعدادات، قد يختلف الأداء خارج هذه الظروف الثابتة.

الأداء وآفاق المستقبل

على الرغم من تأكيد ستابيليتي إيه آي على التحسينات مع SVD 1.1، يبقى فعالية هذه النسخة في العالم الواقعي محل تقييم. تؤكد صفحة Hugging Face الخاصة بالنموذج تصميمه الموجه للأبحاث وتُقر بأن بعض التحديات من الإصدارات السابقة قد تظل قائمة.

بالإضافة إلى Hugging Face، تتوفر نماذج Stable Video Diffusion عبر واجهة برمجة التطبيقات (API) على منصة مطوري ستابيليتي إيه آي، مما يمكّن المطورين من دمج قدرات توليد الفيديو المتقدمة بسلاسة في تطبيقاتهم. تقوم واجهة Stable Video Diffusion API بتوليد أربع ثوانٍ من الفيديو بسرعة 24 إطارًا في الثانية بصيغة MP4، مما ينتج 25 إطارًا مُنشأً بالإضافة إلى إطارات مُعالجة. ميزات مثل التحكم في قوة الحركة ودعم تخطيطات متعددة ودقات مختلفة، تشمل 1024×576 و768×768 و576×1024، تعزز من سهولة الاستخدام.

نظرة نحو المستقبل

في عام 2023، حققت ستابيليتي إيه آي خطوات هامة في مجال الذكاء الاصطناعي التوليدي مع تحديثات نموذجية متكررة، وهي اتجاه يبدو أنه سيستمر حتى عام 2024. تأسست الشركة في عام 2019، وقد جذبت استثمارات كبيرة، منها جولة تمويلية بقيمة 101 مليون دولار في عام 2022. ومع ذلك، تواجه تنافسًا من لاعبين آخرين في مجال توليد الفيديو باستخدام الذكاء الاصطناعي، مثل Runway وPika، اللذان يكتسبان زخمًا مع منصات ويب سهلة الاستخدام تقدم أيضًا تخصيص الفيديو وترقيته.

مؤخراً، قدمت Runway ميزة Multi Motion Brush، مما يتيح للمستخدمين تحريك مناطق محددة من فيديوهاتهم المُنتجة باستخدام الذكاء الاصطناعي. بالمثل، يسمح Pika للمستخدمين بتحرير مناطق معينة في الفيديوهات، مثل تحويل وجه بقرة إلى وجه بطة. ومع ذلك، لا تُشغل أي منهما واجهات برمجة التطبيقات لنماذجها، مما يقيّد الدمج في التطبيقات الخارجية.

بينما يستمر مشهد توليد الفيديو باستخدام الذكاء الاصطناعي في التطور، تمثل SVD 1.1 من ستابيليتي إيه آي تقدمًا مثيرًا يستحق المتابعة.

NVIDIA وسوبريمicro: التقنيات الأساسية للذكاء الاصطناعي لتحقيق النجاح

إيليميند تأمين 12 مليون دولار لتطوير جهاز قابل للارتداء بتقنية الأعصاب يعزز وظائف الدماغ ويحسن جودة النوم

Most people like

Massed Compute

69.8K

اكتشف مزايا مقدمي خدمات السحابة الذين يقدمون إيجارات وحدات معالجة الرسوميات (GPU)، المثالية لمجموعة واسعة من المهام الحاسوبية. سواء كنت بحاجة إلى قوة معالجة متطورة للتعلم الآلي، أو تقديم الفيديو، أو المحاكاة المعقدة، فإن إيجارات وحدات معالجة الرسوميات تقدم حلاً مرنًا وفعالاً من حيث التكلفة. استكشف كيف يمكن لهذه الخدمات أن ترتقي بمشاريعك وتدفع الابتكار في المشهد المعتمد على البيانات اليوم.

الحوسبة السحابية AI Analytics Assistant

APIGen

13.3K

أنشئ وانشر واجهات برمجة التطبيقات المخصصة بسهولة مع منصتنا المبتكرة، المصممة من أجل السرعة والكفاءة. ابدأ اليوم لتبسيط عملية تطويرك!

توليد واجهة برمجة التطبيقات Large Language Models (LLMs)

Type

92.7K

اختبر محرر مستندات مدعوم بالذكاء الاصطناعي بسرعة البرق، الذي يبسط عملية الكتابة لديك من خلال ميزات مثل الصياغة، تحويل النص، والمساعدة الكتابية من الخبراء.

مدعوم بالذكاء الاصطناعي AI Content Generator

LoveCore AI

32.5K

تعزيز الروابط العاطفية مع رفقاء الذكاء الاصطناعي في عصرنا الرقمي اليوم، أصبح من الضروري التواصل عاطفيًا مع رفقاء الذكاء الاصطناعي أكثر من أي وقت مضى. تقدم هذه الكيانات الذكية فرصة فريدة لبناء علاقات هامة، مما يساعد على تقليل الفجوة بين التكنولوجيا والمشاعر الحقيقية. اكتشف كيف يمكنك الانخراط بعمق مع الذكاء الاصطناعي لتعزيز رفاهيتك العاطفية واستكشاف الفوائد العديدة لهذه التفاعل المبتكر.

الذكاء الاصطناعي AI Chatbot

Find AI tools in YBX