ميزة "انقر هنا للاستماع إلى هذه المقالة" المتوفرة في أعلى بعض صفحات الويب تعد ضرورية للأفراد ذوي الإعاقة البصرية وصعوبات القراءة، بالإضافة إلى أولئك الذين يعانون من قيود في الوقت. هذا الأسبوع، قدمت ElevenLabs، الشركة الرائدة في تكنولوجيا الذكاء الاصطناعي الصوتي، "Audio Native"، مشغل الصوت المبتكر الذي يقوم تلقائيًا بسرد محتوى صفحات الويب باستخدام تكنولوجيا تحويل النص إلى صوت المتطورة للشركة.
علاوة على ذلك، أطلقت ElevenLabs "ElevenLabs Reader"، الذي يوفر سردًا بـ 11 صوتًا مختلفًا لصفحات الويب والمستندات. تدعم نماذج أصواتهم 29 لغة، بما في ذلك القدرة على دبلجة الأفلام الطويلة وتحويل العبارات إلى كلمات أغاني. يتاح Audio Native ضمن فئة "المنشئ" مقابل 11 دولارًا في الشهر ويشمل مقاييس مدمجة ولوحة تحكم للمستمع لمراقبة تفاعل الجمهور. على صفحتها في X (سابقًا تويتر)، عرضت ElevenLabs مواقع تستخدم تقنيتها، مثل مدونتها، ودليل الذكاء الاصطناعي لتحسين محركات البحث من bensbites.com، ومقال نشر في نوفمبر 2023 في The New Yorker بعنوان "ليست جميع تهديدات الأمن القومي الأمريكي خارج البلاد". كما تبنت وسائل الإعلام المعروفة مثل The Atlantic وThe New York Times تقنية ElevenLabs. صرح سام سكلا من ElevenLabs في منشور بالمدونة: "إنها قابلة للتخصيص، وسهلة الإعداد، وتعزز تفاعل القراء بينما تجعل محتواك أكثر توفرًا للجماهير في جميع أنحاء العالم."
تضمين الصوت لمواقع الويب
مع Audio Native، يمكن للمستخدمين بسهولة تضمين الصوت لمواقعهم أو دمج الصوت من المشاريع الموجودة باستخدام واجهة برمجة التطبيقات (API) الخاصة بـ ElevenLabs. للقيام بذلك، يحتاج المستخدمون إلى توفير جزء مختصر من HTML، إضافة نطاقهم إلى قائمة "السماح"، اختيار صوت من الخيارات المتاحة، وتخصيص لون الخلفية والنص قبل نسخ ولصق الشيفرة المقدمة على موقعهم. يوفر القاموس الاختياري للنطق إمكانية استخدام تعبيرات خاصة فريدة للعلامة التجارية. بشكل افتراضي، يقوم النموذج بإنشاء voiceovers لكل محتوى نصي في الصفحة، لكن يمكن تخصيص ذلك باستخدام محددات CSS. يدعم الأداة حاليًا منصات مثل React وSquarespace وWordPress وGhost وWebflow وFramer.
تصف التقييمات المبكرة الأداة بأنها "رائعة" و"مذهلة"، مع تسليط الضوء على إمكاناتها الكبيرة في تعزيز إمكانية الوصول.
ابتكارات مستقبلية في الأفق
استنادًا إلى ردود الفعل على وسائل التواصل الاجتماعي، يبدو أن ElevenLabs ملتزمة بتوسيع ميزاتها. عندما اقترح أحد المستخدمين إضافة إمكانيات خلاصة RSS لبث المحتوى المكتوب، رد لوك هاريس، رئيس نمو ElevenLabs، قائلًا: "فكرة رائعة، سأشاركها مع الفريق."
تأسست ElevenLabs في عام 2022 بواسطة المهندس السابق في Google، بيتر دابكوفسكي، والاستراتيجي في Palantir، ماتّي ستانيسزكي، وقد ارتفعت بسرعة إلى تقييم يبلغ 1.1 مليار دولار. حصلت الشركة على 80 مليون دولار في جولتها التمويلية الأخيرة في يناير.
في بيئة تنافسية تضم لاعبين مثل Speechify وDeepgram وVoicemod، تتمتع ElevenLabs بموقع فريد ضمن سوق نسخ الصوت الذكاء الاصطناعي الذي يتوسع بسرعة، والذي من المتوقع أن يصل إلى 16.2 مليار دولار بحلول عام 2032 مع معدل نمو سنوي مركب يبلغ حوالي 28% من 2023.
كما دخلت ElevenLabs في شراكة مع ناشري HarperCollins لإنشاء كتب صوتية مولدة بالذكاء الاصطناعي وأطلقت سوقًا للمستخدمين لتحقيق الربح من الأصوات المستنسخة. ومع ذلك، تواجه الشركة تدقيقًا بشأن قدراتها في توليد الموسيقى والقلق بشأن استخدام المواد المحمية بحقوق الطبع والنشر في تدريب نماذجها، وهو موضوع حظي بزيادة الاهتمام مؤخرًا.