Stability AI تكشف عن عرض بحثي لنماذج نشر الفيديو الثابت لتطبيقات الإبداع.

Home أخبار الذكاء الاصطناعي Stability AI تكشف عن عرض بحثي لنماذج نشر الفيديو الثابت لتطبيقات الإبداع.

Updated on نوفمبر 23 2023

بينما تعيد OpenAI سام ألتمان إلى منصبه، تزداد جهود المنافسين في مجال الذكاء الصناعي (AI). عقب إصدار Claude 2.1 من Anthropic واستحواذ Adobe على Rephrase.ai، أعلنت Stability AI عن Stable Video Diffusion، مما يمثل دخولها إلى مجال توليد الفيديو المتزايد الشهرة.

تقديم Stable Video Diffusion

يتكون Stable Video Diffusion (SVD)، المتاح لأغراض البحث فقط، من نموذجين متقدمين للذكاء الصناعي - SVD و SVD-XT - اللذان يمكنهما توليد مقاطع فيديو قصيرة من الصور الثابتة. وتزعم Stability AI أن هذه النماذج تنتج مخرجات عالية الجودة يمكن أن تنافس أو تتفوق على مولدات الفيديو الحالية.

كلا النموذجين مفتوحا المصدر كجزء من عرض البحث، مع خطط لاستيعاب تعليقات المستخدمين لتحسين الوظائف لتطبيقات تجارية مستقبلية.

فهم Stable Video Diffusion

وفقًا للمدونة الخاصة بـ Stability AI، فإن SVD و SVD-XT هما نماذج انتشار كامنة تقبل صورة ثابتة واحدة لتوليد مقاطع فيديو بحجم 576 × 1024. يمكنهما إنتاج محتوى بسرعات تتراوح بين ثلاث إلى ثلاثين إطارًا في الثانية، على الرغم من أن المقاطع محدودة بأربع ثوانٍ. يقوم نموذج SVD بإنشاء 14 إطارًا من الصورة الثابتة، بينما يمكن لـ SVD-XT إنشاء ما يصل إلى 25 إطارًا.

لتطوير Stable Video Diffusion، قامت Stability AI بتدريب نموذجها الأساسي على حوالي 600 مليون عينة من مجموعة بيانات الفيديو المختارة، تلاها تحسين على مجموعة بيانات أصغر عالية الجودة تحتوي على ما يصل إلى مليون مقطع. يمكّن هذا التدريب النماذج من أداء مهام مثل توليد الفيديو من النص والتوليد من الصورة إلى الفيديو.

بينما تم الحصول على بيانات التدريب من مجموعات بيانات بحثية متاحة للجمهور، تظل الأصول الدقيقة غير محددة.

من المهم أن يشير الورقة البيضاء حول SVD إلى أن هذا النموذج يمكن تحسينه أكثر لدعم تركيب المشاهد المتعددة، مما يسمح بتمثيل متسق لجسم ما من صورة واحدة. تشمل التطبيقات المحتملة لـ Stable Video Diffusion العديد من القطاعات، بما في ذلك الإعلان والتعليم والترفيه.

جودة الإخراج والقيود

في التقييمات الخارجية، أظهرت مخرجات SVD جودة عالية، متفوقة على النماذج المغلقة الرائدة في تحويل النص إلى فيديو من Runway وPika Labs. ومع ذلك، تعترف Stability AI بأن هذه النماذج لا تزال في مراحلها الأولى؛ فهي غالبًا ما تعاني من صعوبة في الواقعية الضوئية، وقد تنتج مقاطع تفتقر إلى الحركة، وغالباً لا تولد الوجوه أو الأشخاص بدقة متوقعة.

للمضي قدمًا، تهدف الشركة إلى تحسين كلا النموذجين، ومعالجة القيود الحالية، وإدخال ميزات جديدة مثل دعم النصوص والدعم التجاري. وتؤكد أن هذا الإصدار يمثل دعوة للتحقيق المفتوح لتحديد وحل المشكلات، بما في ذلك التحيزات المحتملة، لضمان النشر الآمن.

تتخيل Stability AI مجموعة متنوعة من النماذج التي ستبنى على هذا الأساس، مماثلة للنظام البيئي المحيط بالانتشار المستقر. كما تدعو المستخدمين للتسجيل في تجربة ويب قادمة ستمكن من توليد فيديو من النص، على الرغم من أن الجدول الزمني الدقيق لتوفرها لا يزال غير واضح.

كيفية استخدام النماذج

لاستكشاف نماذج Stable Video Diffusion، يمكن للمستخدمين الوصول إلى الكود في مستودع GitHub الخاص بـ Stability AI والأوزان اللازمة لتشغيل النموذج محليًا على صفحتها في Hugging Face. الاستخدام مسموح به فقط بعد قبول الشروط التي تحدد التطبيقات المسموح بها والممنوعة.

حاليًا، تشمل حالات الاستخدام المسموح بها توليد أعمال فنية لأغراض التصميم والأدوات التعليمية أو الإبداعية. ومع ذلك، فإن توليد تمثيلات واقعية للأشخاص أو الأحداث يقع خارج نطاق هذا المشروع، وفقًا لما ذكرته Stability AI.

تطبيق معالجة اللغة الطبيعية في مجال الأمن السيبراني: دليل خطوة بخطوة

الذكاء الاصطناعي: تجاوز ساحة المعركة الأيديولوجية

Most people like

Marketer

22.7K

حلول رقمية شاملة لمبيعات المباني الجديدة.

حلول المبيعات الرقمية Sales Assistant

Sudowrite

681.7K

اكتشف سودو رايت، أداة الكتابة المبتكرة المدعومة بالذكاء الاصطناعي، المصممة لتسريع عملية تأليف الروايات والنصوص السينمائية. لقد نالت هذه الحلول المتطورة إشادة واسعة بفضل قدرتها على تعزيز الإبداع وتبسيط الكتابة، مما جعلها مفضلة بين الكتاب الطموحين والمحترفين على حد سواء.

أداة كتابة بالذكاء الاصطناعي AI Book Writing

Pillar

182.2K

اكتشف إمكانياتك الإبداعية مع منصتنا المدعومة بتقنية الذكاء الاصطناعي، المصممة لبيع المنتجات الرقمية وتأمين الشراكات التجارية. مثالية للمبدعين الذين يسعون لتعزيز أعمالهم من خلال أدوات مبتكرة وعمليات مبسطة، منصتنا تسهل الرحلة من إنشاء المنتج إلى التعاون الناجح مع العلامات التجارية. ابدأ في الازدهار في السوق الرقمية اليوم!

نظام الدفع المدعوم بالذكاء الاصطناعي Bio Link

Trellus

43.3K

تقديم Trellus، أداة مبتكرة مدفوعة بالذكاء الاصطناعي مصممة لتوفير تدريب شخصي وتحليلات فورية لمندوبي المبيعات خلال مكالماتهم الباردة. مع Trellus، قم بتحسين استراتيجيتك في المكالمات الباردة وزيادة نجاح المبيعات من خلال رؤى وإرشادات مخصصة.

تدريب مبيعات الذكاء الاصطناعي Sales Assistant

Find AI tools in YBX