오늘 Pixel 9 시리즈 출시 행사에서 Google은 Gemini Live 서비스를 공개했습니다. 이 서비스는 현재 영어를 사용하는 Gemini Advanced 구독자에게 제공되며, 보다 자연스럽고 유연한 대화 경험을 제공합니다.
Gemini Live는 Google의 AI 음성 기술에서 중요한 발전을 의미합니다. 개선된 음성 엔진은 일관성 있고 감정이 풍부하며 현실적인 다중 턴 대화를 구현하는 것을 목표로 하고 있습니다. 이 서비스는 OpenAI의 ChatGPT에 새로 도입된 Advanced Voice 모드와 직접 경쟁하며, AI 음성 채팅 기술을 한층 다닙니다.
Google에 따르면, Gemini Live는 사용자가 Gemini와 원활하게 대화할 수 있는 모바일 대화 경험을 제공합니다. 대화 중 사용자는 Gemini의 말을 쉽게 중단하고 후속 질문을 하거나, 실시간으로 말하는 스타일을 변경할 수 있어 더 자연스러운 의사소통이 가능합니다. 또한, Gemini Live는 사용자가 선택할 수 있는 10개의 새로운 자연스러운 음성을 제공하여 개인화된 대화를 풍부하게 해줍니다.
행사에서는 모의 인터뷰에서의 Gemini Live 활용 사례도 선보이며, 사용자가 채용 담당자(또는 AI)와 상호작용하며 말하기 능력에 대한 피드백과 최적화 팁을 받을 수 있게 했습니다. 이 기능은 사용자들의 인터뷰 성과를 향상시킬 뿐 아니라 Gemini Live의 광범위한 잠재력을 보여줍니다.
현재 Gemini Live는 음성 채팅에서 큰 발전을 이루었지만, 다중 모달 입력 기능은 지원하지 않는 점을 유의해야 합니다. Google은 5월 I/O 컨퍼런스에서 Gemini Live가 모바일 카메라를 통해 환경을 캡처하고 응답할 수 있는 기능을 시연했으나, 이 기능은 "올해 후반"으로 지연될 것으로 예상하고 있습니다. Google은 다중 모달 입력 통합을 통해 Gemini Live의 상호작용 기능을 더욱 풍부하게 하여 보다 포괄적인 스마트 경험을 제공할 것이라고 밝혔습니다.
Gemini Live 서비스의 도입으로 Google은 AI 음성 채팅 분야에서의 리더십을 확고히 했습니다. 앞으로 이어지는 기술 발전은 사용자에게 더욱 놀랍고 편리한 경험을 제공할 것입니다.