Изучите креативные способы использования нового голосового режима ChatGPT.

Advanced Voice Mode от ChatGPT был запущен во вторник для избранных подписчиков OpenAI в рамках долгожданного альфа релиза. Эта функция, впервые анонсированная в мае, кардинально меняет взаимодействие, перемещая общение за пределы традиционного текстового диалога и позволяя пользователям общаться на естественном разговорном языке с живым качеством. Она поддерживает ряд региональных акцентов и языков. По данным OpenAI, Advanced Voice нацелена на предоставление "более естественных, реальных разговоров в реальном времени, допускает перебивания в любой момент и чувствует и реагирует на ваши эмоции".

Тем не менее, использование Voice Mode имеет свои ограничения. Система работает с четырьмя предустановленными голосами и не может имитировать голоса отдельных пользователей или общественных фигур. Выходы, которые отклоняются от этих предустановок, автоматически блокируются. Кроме того, Advanced Voice не предназначена для создания авторского аудио или музыкальных произведений. Интересно, что пользователи уже экспериментировали с ней, прося ИИ делать битбокс.

Альфа-тестировщик Итан Сутин поделился в X (ранее Twitter) потоком, демонстрирующим различные ответы Advanced Voice, включая короткий "реп для дня рождения" и демонстрацию битбокса. Пользователи могут слышать цифровое дыхание ИИ между звуками. Хотя она не может создавать полные песни, ИИ впечатляюще добавляет звуковые эффекты к сказкам на ночь, улучшая опыт рассказывания историй. Например, при создании атмосферной сказки о мятежном киборге ИИ генерирует подходящие звуки ударов и громов.

Advanced Voice также может спонтанно создавать реалистичных персонажей, что добавляет жизненности. Пользователи могут просить ИИ говорить различными тонами и на разных языках, что усиливает взаимодействие.

Вокальные возможности ИИ выходят за рамки человеческих языков. Например, по запросу Advanced Voice может точно имитировать звуки кошек. Пользователи могут задавать ИИ вопросы о своих пушистых компаньонах, получая индивидуальные советы и рекомендации в реальном времени.

Кроме того, Advanced Voice может использовать камеру вашего устройства для поддержки переводческих усилий. В одном случае пользователь направил телефон на японскую игру GameBoy Advance Pokémon, что позволило ИИ читать диалоги на экране во время игры. Хотя функции видеозаписи и совместного использования экрана не входят в альфа релиз, OpenAI планирует в скором времени представить их. Компания намерена расширить альфа релиз для большего числа подписчиков Plus в ближайшие недели, с полным запуском, запланированным на осень.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles