Обновление от OpenAI весной 2024 года в мае ознаменовалось представлением GPT-4o и долгожданного голосового режима для ChatGPT. Эта новая функция направлена на создание более естественного, разговорного взаимодействия с AI, включая эмоциональную интонацию и способность управлять прерываниями. Однако запуск голосового режима задерживается как минимум на месяц, с новыми ожиданиями на конец июля или начало августа. Изначально он будет доступен лишь небольшой группе пользователей.
OpenAI объявила о задержке через свой аккаунт в X, указав на необходимость дополнительного времени для доработки голосового режима. Компания подчеркнула улучшение возможностей модели по обнаружению и отказу от неподобающего контента.
В заявлении говорилось: «Мы планировали запустить голосовой режим в альфа-версии для избранной группы пользователей ChatGPT Plus в конце июня, но нам нужно еще месяц, чтобы соответствовать нашим стандартам качества. Мы улучшаем возможности обнаружения контента, повышаем качество пользовательского опыта и обеспечиваем эффективное масштабирование нашей инфраструктуры для предоставления ответов в реальном времени. Наша стратегия поэтапного развертывания включает сбор отзывов от начальной группы пользователей перед расширением доступа для всех Plus пользователей осенью, при условии соблюдения наших стандартов безопасности и надежности».
Голосовой режим обещает позволить AI понимать и реагировать с учетом эмоциональных и невербальных сигналов, улучшая качество общения. OpenAI придерживается обязательства осторожно вводить эти новшества.
Эта задержка создает трудности для OpenAI в условиях конкуренции с такими соперниками, как Anthropic, которая недавно выпустила модель Claude 3.5 Sonnet, якобы превосходящую GPT-4o по нескольким внешним оценкам. OpenAI также находится под scrutiny за свои меры безопасности в стремлении к достижению искусственного общего интеллекта (AGI), что привело к внутренней критике из-за ограничительных соглашений по разделу средств и ограничений на доли—многие из которых уже были пересмотрены.
Внешняя критика продолжает поступать, в том числе от актрисы Скарлетт Йоханссон, которая протестовала против голоса AI «Sky», который, по ее мнению, напоминал ее собственный без ее согласия. OpenAI ответила, уточнив, что голосовая актриса для Sky была выбрана отдельно от Йоханссон, хотя компания уже отключила этот AI-голос.
Несмотря на эти проблемы, OpenAI продолжает привлекать новых пользователей и партнеров, включая сотрудничество в творческой индустрии с еще не выпущенной моделью видео AI Sora и интеграцию GPT-4o в приложения здравоохранения, такие как инструмент для скрининга рака для Color, а также привлечение множества корпоративных клиентов.