بعد أيام من الكشف عن النسخة المطورة من شخصية ChatGPT القادرة على تقديم ردود فعل تشبه الإنسان في الوقت الحقيقي، قررت OpenAI تعليق ميزة الصوت "Sky" التي تم مناقشتها كثيراً. جاء هذا القرار في ضوء المخاوف من أن صوت "Sky" يشبه بشكل ملحوظ أداء سكارليت جوهانسون كشخصية الذكاء الاصطناعي في فيلم "Her". وقد نفت OpenAI الادعاءات بأن الصوت يمثل تقليداً مباشراً، موضحة أنه يتم استخدام "صوت ممثلة محترفة مختلفة تتحدث بصوتها الطبيعي".
حالياً، لا يزال من غير الواضح متى أو إذا ما سيتم إعادة تفعيل صوت "Sky". ومع ذلك، يمكن لمستخدمي ChatGPT الاختيار من بين أربع خيارات صوتية بديلة: Breeze وCove وEmber وJuniper.
بعد هذا الإعلان، شارك الصحفي ياشار علي بياناً من ممثل جوهانسون، يؤكد أن جوهانسون قد طُلب منها الصوت من قبل الرئيس التنفيذي لـ OpenAI، سام ألتمان، قبل إطلاق الصوت الجديد لكنها رفضت. وأعربت جوهانسون عن صدمتها وإحباطها عند سماع العينة، مشيرة إلى أن الصوت كان مشابهًا بشكل مقلق لصوتها، مما أدى إلى إرباك الكثيرين — بما في ذلك الأصدقاء ووسائل الإعلام.
أطلقت OpenAI ميزات الصوت لـ ChatGPT في سبتمبر 2023، لكن النموذج الأولي عانى من تأخير ملحوظ بسبب اعتماده على ثلاثة أنظمة مختلفة: واحد لتحويل الصوت إلى نص، وGPT-3.5/GPT-4 لتوليد الردود، وآخر لتحويل النص مرة أخرى إلى صوت. نتج عن ذلك صعوبة في استجابة الذكاء الاصطناعي للنبرة والتحدث مع عدة متحدثين والضوضاء الخلفية.
لمعالجة هذه القيود، أعلنت OpenAI مؤخرًا عن GPT-4o — ذكاء اصطناعي موحد ومتعدد الوسائط في الوقت الحقيقي يدمج النص والصوت والرؤية، ويقدم ردوداً في حوالي 320 مللي ثانية. وقد مكنت هذه الترقية ChatGPT من أن يصبح منافساً محتملاً للمساعدين الصوتيين المعروفين مثل Siri وAlexa.
بعد الإطلاق، بدأ المستخدمون بسرعة بملاحظة أن صوت "Sky" يذكر بشكل ملحوظ بشخصية "Samantha" من فيلم "Her" مما أثار تكهنات حول احتمال استخدام OpenAI لتقنية الذكاء الاصطناعي لتقليد خصائص صوت جوهانسون.
استجابةً لهذه المخاوف، أوقفت OpenAI صوت "Sky" مع توضيحها أنه ليس تقليداً لصوت جوهانسون، بل هو صوت ممثلة محترفة تم اختيارها بعد عملية توظيف استمرت خمسة أشهر. وقالت OpenAI في منشور مدونة: "نعتقد أن أصوات الذكاء الاصطناعي لا يجب أن تحاكي عمداً الصوت المميز لأي شخصية مشهورة". وأكدت أن الأصوات — التي تم اختيارها من مجموعة تضم 400 متقدم — قد تم اختيارها وفقًا لمعايير تعكس التنوع والخلود والحنان.
في ظل تعليق صوت "Sky"، تظل الخيارات الصوتية الأربعة الأخرى متاحة. ومع الإطلاق القادم لوضع الصوت الجديد في GPT-4o، يمكن للمستخدمين استكشاف هذه البدائل أثناء تفاعلهم مع الذكاء الاصطناعي.
أما بالنسبة لمستقبل صوت "Sky"، فلا يزال غير واضح ما هي التعديلات التي تخطط OpenAI لتنفيذها لمعالجة المخاوف المتعلقة بالتشابه مع شخصية جوهانسون. تظل الشركة ملتزمة بالتعاون مع الممثلين الصوتيين المعنيين وتخطط لتوسيع عروضها بخيارات صوتية إضافية لتلبية تفضيلات واهتمامات المستخدمين المتنوعة.