إطلاق أداة مفتوحة المصدر من ElevenLabs لإضافة المؤثرات الصوتية بسهولة إلى الفيديوهات

بعد أسابيع من إطلاق تقنيتها لتوليد الصوت من النصوص، كشفت شركة ElevenLabs الناشئة في مجال الصوتيات عن أداة مفتوحة المصدر تهدف إلى عرض قدراتها. تتيح هذه التطبيق للمبدعين توليد عينات من المؤثرات الصوتية لVideosهم في وقت قصير جداً، حيث يمكنه تحليل الفيديو المستورد وتقديم خيارات صوتية متعددة في 15 ثانية فقط.

يمكن للمطورين الوصول إلى كود التطبيق على GitHub، بينما يتيح موقع مخصص للجمهور تجربة واجهة برمجة التطبيقات (API) للمؤثرات الصوتية. عند رفع فيديو، يقوم تطبيق تحويل الفيديو إلى مؤثرات صوتية باستخراج أربعة إطارات بفواصل زمنية قدرها ثانية واحدة على جانب العميل. يتم إرسال هذه الإطارات، مع مطالبة، إلى GPT-4 من OpenAI لإنشاء طلب مخصص لتحويل النص إلى مؤثرات صوتية. ثم تُستخدم هذه المطالبة لتوليد المؤثرات الصوتية من خلال واجهة برمجة التطبيقات الخاصة بـ ElevenLabs. أخيراً، يتم دمج الفيديو والصوت على جانب العميل في ملف قابل للتنزيل بدلا يصل طوله إلى 22 ثانية.

يقول عمار رشي، قائد التصميم في ElevenLabs: "نرى في ذلك دليلاً على ما يمكن للمستخدمين تحقيقه باستخدام واجهة برمجة التطبيقات الخاصة بالمؤثرات الصوتية." ويضيف: "غالباً ما يسعى منشئو الفيديو المدعوم بالذكاء الاصطناعي للحصول على المؤثر الصوتي المثالي، ونسعى لتبسيط هذه العملية من خلال تحليل الإطارات الفيديو وتقديم المخرجات المثلى." ويؤكد على الإمكانات الموجودة في خلق تجارب ديناميكية، خاصة في ألعاب الفيديو الغامرة، حيث يمكن أن تتطور المؤثرات الصوتية بناءً على تفاعلات اللاعبين.

تمكن واجهة برمجة التطبيقات المطورين من إنشاء مؤثرات صوتية مخصصة باستخدام أوصاف قصيرة. تفرض ElevenLabs رسومًا بناءً على الاستخدام، إما عن طريق 100 حرف لكل عملية إنتاج مع مدة تلقائية أو 25 حرفًا في الثانية لمدة محددة.

في اختبار سريع، كان تطبيق تحويل الفيديو إلى مؤثرات صوتية سهل الاستخدام. بعد استيراد مقطع صامت لمركبة في بيئة وعرة، قامت تقنية AI الخاصة بـ ElevenLabs بتوليد أربع خيارات صوتية، جميعها تشبه سيارة تسير على طريق حصوي. بينما يمكن أن يكون إضافة المؤثرات الصوتية إلى المقاطع مسليًا، تكمن الإمكانيات الحقيقية في إدماج هذه القدرة في أنظمة أوسع لتحقيق تأثير أكبر.

مع تطور مشهد توليد الفيديو بالذكاء الاصطناعي، تهدف ElevenLabs إلى أن تبقى في طليعة الابتكار من خلال تقديم حلول صوتية تلبي احتياجات المطورين وصناع الأفلام ومنشئي المحتوى.

Most people like

Find AI tools in YBX