Всего через несколько дней после представления обновленного аватара ChatGPT, способного отвечать в режиме реального времени с человеческими интонациями, OpenAI решила приостановить работу обсуждаемой функции голосового интерфейса "Sky". Это решение вызвано опасениями, что голос Sky слишком напоминает игруScarlett Johansson в роли AI-персонажа в фильме "Она". OpenAI опровергла заявления о том, что голос является прямой имитацией, уточнив, что в его основе лежит "другая профессиональная актриса, использующая свой естественныйSpeaking voice".
На данный момент неясно, когда и будет ли восстановлен голос Sky. Тем не менее, пользователи ChatGPT по-прежнему могут выбирать из четырех альтернативных голосов: Breeze, Cove, Ember и Juniper.
После этого объявления журналист Яшар Али представил заявление от представителя Джонассона, подтвердив, что она была приглашена генеральным директором OpenAI Сэмом Альтманом для записи своего голоса до запуска новой функции, но отказалась. Джонассон выразила шок и разочарование, услышав демоверсию, отметив, что голос был пугающе похож на ее собственный, что привело к путанице среди многих, включая друзей и новостные агентства.
OpenAI представила голосовые функции для ChatGPT в сентябре 2023 года, но первоначальная модель демонстрировала заметную задержку из-за своей зависимости от трех систем: одной для транскрибирования аудио в текст, GPT-3.5/GPT-4 для генерации ответов и другой для конвертации текста обратно в аудио. В результате AI испытывал трудности с реагированием на тон, множество говорящих и фоновый шум.
Чтобы преодолеть эти ограничения, OpenAI недавно анонсировала GPT-4o — унифицированный мультимодальный искусственный интеллект, который интегрирует текст, голос и визуальные элементы, обеспечивая ответы примерно за 320 миллисекунд. Это обновление укрепило позицию ChatGPT в качестве потенциального конкурента таким голосовым помощникам, как Siri и Alexa.
После запуска пользователи быстро заметили, что голос Sky поразительно похож на AI-персонажа "Саманту" из "Она", что вызвало спекуляции о том, использовала ли OpenAI AI для воспроизведения голосовых характеристик Джонассона.
В ответ на эти опасения OpenAI приостановила использование голоса Sky, уточнив, что это не имитация Джонассона, а голос профессиональной актрисы, отобранной после пяти месяцев трудоемкого рекрутинга. "Мы считаем, что голоса AI не должны намеренно подражать знаковым голосам знаменитостей," — заявила OpenAI в блоге. Они подчеркнули, что голоса были выбраны из 400 претендентов на основе критериев разнообразия, вечности и тепла.
На фоне приостановки функции Sky, другие четыре голосовых варианта остаются доступными. С предстоящим запуском нового Режима Голоса GPT-4o пользователи смогут исследовать эти альтернативы при взаимодействии с AI.
Что касается будущего голоса Sky, пока неясно, какие изменения OpenAI планирует внести для решения вопросов, касающихся его сходства с персонажем Джонассона. Компания по-прежнему намерена сотрудничать с актерами озвучивания и планирует расширить свои предложения дополнительными голосовыми опциями, чтобы учесть различные предпочтения и интересы пользователей.