No evento de lançamento da série Pixel 9, o Google revelou seu serviço Gemini Live, que está disponível inicialmente para assinantes do Gemini Advanced que falam inglês. Este serviço inovador visa proporcionar uma experiência de conversação mais natural e fluida.
O Gemini Live representa um avanço significativo na tecnologia de voz da IA do Google. Com um motor de voz aprimorado, o serviço busca oferecer diálogos coerentes, emocionais e realistas em múltiplas interações. Essa novidade compete diretamente com o modo de Voz Avançada recentemente lançado pela OpenAI para o ChatGPT, impulsionando ainda mais a tecnologia de chat por voz.
De acordo com o Google, o Gemini Live proporciona uma nova experiência de conversação móvel, permitindo que os usuários participem de diálogos sem interrupções. Durante as conversas, é possível interromper o Gemini com facilidade para fazer perguntas adicionais, ajustar seu estilo de fala em tempo real e desfrutar de uma comunicação mais orgânica. Além disso, o Gemini Live apresenta dez novas vozes naturais para os usuários escolherem, enriquecendo a personalização nas interações.
O evento também destacou a aplicação do Gemini Live em entrevistas simuladas, permitindo que os usuários interajam com um gerente de contratação (ou IA) para receber feedback sobre suas habilidades de fala e dicas de otimização. Esse recurso não apenas melhora o desempenho dos usuários em entrevistas, mas também demonstra o amplo potencial das aplicações do Gemini Live.
É importante ressaltar que, embora o Gemini Live tenha avançado consideravelmente em chat por voz, atualmente não suporta recursos de entrada multimodal. O Google havia demonstrado a capacidade do Gemini Live de capturar e responder ao ambiente por meio de câmeras móveis na conferência I/O em maio, mas essa função deve ser adiada para "mais tarde neste ano". A empresa afirma que a integração de entrada multimodal enriquecerá ainda mais as capacidades de interação do Gemini Live, proporcionando uma experiência inteligente mais completa.
Com o lançamento do serviço Gemini Live, o Google reafirma sua liderança no domínio de chat por voz com IA. No futuro, os avanços tecnológicos contínuos prometem oferecer aos usuários ainda mais surpresas e conveniências.