ستابل أوديو أوبن: خيار جديد لإنشاء الصوت مع نموذج ستابل إيه آي المفتوح لتوليد الصوت.

مؤخراً، أطلقت Stability AI نموذجاً رائداً ومفتوح المصدر يُدعى Stable Audio Open، والذي يوسع تقنيتها المعروفة Stable Diffusion من تحويل النص إلى صورة إلى عالم الصوت. يولد هذا النموذج عينات صوتية عالية الجودة ومتنوعة استنادًا إلى التعليمات المقدمة من المستخدمين، مما يجلب حياة جديدة لتكوين الموسيقى وتصميم الصوت.

يستخدم Stable Audio Open نموذج انتشار قائم على المحوِّلات (DiT) لإنشاء الصوت ضمن الفضاء الكامن لجهاز التشفير التلقائي، مما يعزز بشكل كبير جودة وتنوع الأصوات المُنتَجة. يمكن للنموذج إنتاج مقاطع موسيقية تصل مدتها إلى 47 ثانية، مما يجعله مثالياً لمجموعة متنوعة من التطبيقات مثل إيقاعات الطبول، الألحان الآلية، الأصوات المحيطية، والتأثيرات الصوتية.

النموذج متاح الآن كمصدر مفتوح على منصة HuggingFace، مما يتيح للمستخدمين تجربته مباشرة. خلال عملية تدريبه، تم تغذيته بأكثر من 486,000 عينة من مكتبات الموسيقى مثل FreeSound و Free Music Archive، مما يضمن تغطية واسعة للأنماط والأنواع في الصوت المُنتَج.

من المهم الإشارة إلى أن Stable Audio Open يتفوق في توليد مقاطع موسيقية قصيرة عالية الجودة، ولكنه ليس مصمماً لإنشاء أغاني كاملة أو ألحان أو مسارات غنائية. النموذج مصمم كأداة سريعة ومرنة لإنشاء الصوت بدلاً من كونه بديلاً لبرامج إنتاج الموسيقى الاحترافية.

بالإضافة إلى ذلك، يختلف Stable Audio Open عن النموذج التجاري السابق لـ Stability AI، Stable Audio 2.0، الذي يمكنه إنشاء مسارات صوتية كاملة تصل إلى 3 دقائق لتلبية احتياجات أوسع في إنشاء الصوت. بالمقابل، يركز Stable Audio Open على مقاطع صوتية قصيرة وتأثيرات صوتية، مما يوفر للمستخدمين تخصيصًا أكبر ومرونة.

تُعد إطلاق Stable Audio Open خطوة كبيرة لـ Stability AI في مجال توليد الصوت. مع استمرار تطور تقنية الذكاء الاصطناعي، نتطلع إلى رؤية المزيد من النماذج المبتكرة والعملية في توليد الصوت وتطبيقاتها.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles