أطلقت WellSaid Labs، الرائدة في تكنولوجيا الصوت المعتمد على الذكاء الصناعي، أداة مبتكرة تسمح للمستخدمين بالتوجيه نحو أداء صوتي AI بشكل أكثر طبيعية وعمقًا. تسمى هذه الميزة الجديدة HINTS (خطاب مصمم بشكل طبيعي وبديهي)، وهي تمكن صانعي المحتوى من تخصيص أصوات الذكاء الاصطناعي باستخدام تعليقات سياقية، مثل ضبط الإيقاع ودرجة الصوت، تمامًا كما يعمل مخرج الأفلام.
شارك مايكل بيتروتشوك، المؤسس المشارك والرئيس التنفيذي للتكنولوجيا في WellSaid Labs، في مقابلة حصرية قائلاً: "عبر عملاؤنا عن رغبتهم في مزيد من السيطرة على نتائج الصوت من الذكاء الاصطناعي لدينا. هدفنا كان إنشاء نظام يكون بديهيًا وطبيعيًا، مما يمكّن نموذجنا من توقع أداءات أصيلة بناءً على سياق المستخدم، حتى يتمكن الإبداعيون من تحقيق رؤيتهم الفنية."
تمثل HINTS انحرافاً عن الطرق التقليدية التي تعتمد على لغات تعليمية صلبة أو موجهات بسيطة للتحكم في أصوات الذكاء الصناعي. تسمح هذه التقنية الجديدة بإجراء تعديلات دقيقة وقابلة للتطبيق—مثل تعديل مقطع معين ليكون أبطأ بنسبة 0.7x أو زيادة الصوت بمقدار 5 ديسيبل—بينما تستجيب صوت الذكاء الاصطناعي بسلاسة. تمكن الوعي السياقي المستخدمين من إضافة والتعشيق بين التعليقات عبر نصوص طويلة.
وأوضح بيتروتشوك: "يستخدم النظام بيانات بشرية حقيقية (تم الحصول عليها بموافقة) لإنتاج مخرجات صوتية، مما يجعل التعبيرات المشروطة واقعياً مثل تلك التي لا تحتوي على تعليقات." وأضاف: "من المدهش أننا وجدنا أن النموذج يستخدم مجموعة بيانات واحدة بفعالية، ولكنه يستطيع أيضًا التعميم عبر أداءات من متحدثين متعددين لتعزيز تنغيمه. هذه الاكتشافات تجاوزت توقعاتنا وتبرز إمكانية البحث المستقبلي."
تلبية HINTS للطلب على أدوات الصوت AI القابلة للتخصيص والتي تركز على المخرجين، قد تحوّل المحتوى الصوتي، سواء كان كتب صوتية، أو وحدات تدريبية، أو فيديوهات تسويقية، وغيرها. تشير التقييمات الأولية إلى تحسينات في الدقة والطبيعية.
تولّي الأبحاث أيضًا أولوية الممارسات الأخلاقية والمسؤولة في الذكاء الاصطناعي. وأشار بيتروتشوك إلى أن "منذ البداية، كنا ملتزمين بالابتكار الأخلاقي." تضمن WellSaid الحصول على موافقة واضحة من المساهمين الصوتيين، وتحمي الخصوصية، وتقوم بوساطة المحتوى لمنع الإساءة.
مع تزايد دمج الذكاء الاصطناعي الصوتي في تكنولوجيا المستهلك والترفيه، تجسد HINTS كيف يمكن لهذه التكنولوجيا أن تعمل كوسيط قصصي متعاطف بدلاً من كونها أداة صوتية فقط. وبينما لا تزال هناك قيود مقارنة بالمواهب البشرية، فإن الابتكارات مثل HINTS تقربنا خطوة نحو تحقيق أصوات صناعية تعبيرية حقًا.