На сегодняшнем мероприятии по запуску серии Pixel 9 Google представила сервис Gemini Live, который вначале будет доступен подписчикам Gemini Advanced, говорящим на английском. Эта инновационная услуга направлена на обеспечение более естественного и плавного общения.
Gemini Live представляет собой значительный шаг вперёд в технологии голосового ИИ от Google. С улучшенным голосовым движком сервис стремится предоставить осмысленные, эмоциональные и реалистичные многократные беседы. Он напрямую конкурирует с недавно введённым режимом Advanced Voice от OpenAI для ChatGPT, способствуя развитию технологий голосового общения.
Согласно информации от Google, Gemini Live предлагает новый мобильный опыт общения, позволяя пользователям легко взаимодействовать с Gemini. Во время общения пользователи могут без труда перебивать Gemini, задавать дополнительные вопросы, изменять стиль речи в реальном времени и наслаждаться более органичным обменом. Кроме того, Gemini Live предлагает десять новых естественно звучащих голосов на выбор, что улучшает персонализацию бесед.
На мероприятии также демонстрировалось применение Gemini Live в имитационных интервью, где пользователи могут взаимодействовать с менеджером по найму (или ИИ) для получения обратной связи о своих навыках речи и советов по оптимизации. Эта функция не только повышает эффективность собеседований, но и подчеркивает широкий потенциал применения Gemini Live.
Важно отметить, что, хотя Gemini Live достиг значительных успехов в голосовом общении, в настоящее время он не поддерживает многофункциональные входные данные. Google ранее продемонстрировала способность Gemini Live захватывать и реагировать на окружающую среду с помощью мобильных камер на конференции I/O в мае, однако эта функция, как ожидается, будет отложена до «позже в этом году». Google сообщает, что интеграция многофункциональных входных данных дополнительно обогатит возможности взаимодействия Gemini Live, предлагая ещё более комплексный умный опыт.
С введением сервиса Gemini Live Google укрепила свои позиции в области голосового ИИ. В дальнейшем постоянные технологические усовершенствования обещают пользователям новые удивительные возможности и удобства.