أطلق إبداعك: ElevenLabs تستعد لإطلاق مؤثرات صوتية مدعومة بالذكاء الاصطناعي

بعد إتقان تقنيات استنساخ الصوت وتوليده باستخدام التعلم الآلي، توسعت ElevenLabs، وهي شركة ناشئة في مجال الذكاء الاصطناعي تأسست منذ عامين على يد موظفين سابقين في Google وPalantir، في عروضها مع نموذج جديد لتحويل النص إلى صوت.

تم الإعلان مؤخرًا عن هذا الابتكار في مجال الذكاء الاصطناعي، الذي سيمكن المبدعين من إنشاء مؤثرات صوتية ببساطة من خلال وصف رؤيتهم بالكلمات، مما يعزز المحتوى في هذا العصر المتطور من التجارب الرقمية المدفوعة بالذكاء الاصطناعي. ورغم أن النموذج ليس متاحًا للعامة بعد، أصدرت ElevenLabs مقطع فيديو توضيحيًا يعرض قدراته باستخدام مقاطع تم إنشاؤها بواسطة Sora من OpenAI، والتي تم تعزيزها بأصوات مولدة بواسطة الذكاء الاصطناعي من الشركة. كما أطلقوا صفحة للتسجيل في قائمة الانتظار للحصول على الوصول المبكر.

توسيع إمكانيات الصوت باستخدام مؤثرات صوتية بالذكاء الاصطناعي

تأسست ElevenLabs في عام 2022، وتهدف إلى جعل المحتوى السمعي والمرئي أكثر وصولاً عبر اللغات والمناطق. تقدم الشركة مجموعة متنوعة من الأدوات، بما في ذلك نماذج تحويل النص إلى كلام والكلام إلى كلام، القادرة على إنتاج خطاب مولد بواسطة الذكاء الاصطناعي من مصادر محتوى مختلفة (نص، صوت، أو فيديو) بـ 29 لغة، مع الحفاظ على صوت طبيعي وتعبير عاطفي.

تكتسب هذه الأدوات شهرة متزايدة بين الشركات والمبدعين الأفراد. بالتوازي، يتزايد المحتوى المولد بالكامل بواسطة الذكاء الاصطناعي، وذلك بفضل أدوات مثل Runway وPika، إلى جانب Sora من OpenAI. بينما يمكن لهذه المنتجات إنشاء مقاطع فيديو واقعية من نصوص بسيطة، غالبًا ما تفتقر إلى الصوت المصاحب. يهدف النموذج الجديد من ElevenLabs إلى سد هذه الفجوة، حيث يمكن للمستخدمين إنتاج مؤثرات صوتية لمحتواهم استنادًا إلى أوصاف نصية.

مع هذا العرض، يمكن لمبدعي الذكاء الاصطناعي تعزيز مشاريعهم بسلاسة باستخدام الأصوات الخلفية، من تغريدات الطيور إلى ضوضاء الشوارع المزدحمة. قال لوك هاريس، رئيس النمو في ElevenLabs: "لقد عرضنا بشكل رئيسي نماذج تحويل النص إلى كلام علنًا، ولكن لدينا الكثير في طور التطوير. عندما كشفت OpenAI عن Sora، التي تنتج مقاطع فيديو مثيرة دون صوت، قررنا تقديم لمحة عن خط منتجاتنا القادمة."

يمكن أيضًا تطبيق الأصوات التي ينتجها هذا النموذج الجديد على المحتوى المنطوق من نص أو أي مشروع فيديو يتطلب صوتًا خلفيًا، مثل مقاطع إنستغرام، الإعلانات، أو إعلانات الألعاب. لا يزال جودة ومرونة هذه المؤثرات الصوتية بحاجة إلى تقييم.

سجل للحصول على الوصول المبكر

بينما لم تعلن ElevenLabs عن موعد إطلاق علني، فإنها تقبل الآن التسجيلات للحصول على الوصول المبكر. يمكن للأفراد المهتمين زيارة صفحة التسجيل الخاصة بهم، حيث يقومون بتقديم اسمهم وبريدهم الإلكتروني ووصف استخدامهم المتوقع لمؤثرات الصوت. يُشجع المتطوعون الأوائل على كتابة نموذج نصي لمؤثر صوتي بالذكاء الاصطناعي للمساعدة في تحسين استجابات النموذج.

بعد التسجيل، سينضم المستخدمون إلى قائمة الانتظار وسيحصلون على الوصول عند توفر النموذج، على الرغم من أن الجدول الزمني لا يزال غير واضح.

قد تمتلك ElevenLabs ميزة المنافسة الأولى بهذه التقنية، لكن هناك شركات أخرى في قطاع الصوت بالذكاء الاصطناعي، مثل MURF.AI وPlay.ht وWellSaid Labs، بإمكانها أيضًا تطوير منتجات مماثلة. وفقًا لتقارير Market US، تم تقييم السوق العالمي لأدوات الصوت بالذكاء الاصطناعي بمبلغ 1.2 مليار دولار في عام 2022، ومن المتوقع أن يصل إلى نحو 5 مليارات دولار بحلول عام 2032، بمعدل نمو سنوي مركب يزيد عن 15.40%.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles