谷歌推出Gemini Live:开启AI语音聊天新时代

在今天的Pixel 9系列发布会上,谷歌推出了Gemini Live服务,该服务首批面向讲英语的Gemini Advanced订阅用户。这项创新服务旨在提供更自然、流畅的对话体验。

Gemini Live标志着谷歌在人工智能语音技术上的重要进步。通过改进的语音引擎,它旨在实现连贯、富有情感且逼真的多轮对话。这项服务直接与OpenAI最近推出的ChatGPT高级语音模式展开竞争,推动了AI语音聊天技术的进一步发展。

谷歌表示,Gemini Live为用户提供全新的移动对话体验,使他们能够与Gemini进行无缝交流。在聊天过程中,用户可以轻松打断Gemini,提出后续问题,实时调整其语音风格,享受更加自然的交流体验。此外,Gemini Live增加了十种自然的语音选择,进一步增强了对话的个性化。

发布会上还展示了Gemini Live在模拟面试中的应用,用户可以与招聘经理(或AI)互动,获取关于演讲技巧和优化建议的反馈。这一功能不仅提升了用户的面试表现,还展示了Gemini Live的广泛潜力。

需要注意的是,尽管Gemini Live在语音聊天方面取得了重大进展,但目前尚不支持多模态输入功能。谷歌在5月的I/O大会上曾展示了Gemini Live通过手机摄像头捕捉和响应环境的能力,但这一功能预计将延迟到“今年晚些时候”推出。谷歌表示,集成多模态输入将进一步丰富Gemini Live的互动能力,提供更加全面的智能体验。

随着Gemini Live服务的推出,谷歌巩固了其在AI语音聊天领域的领导地位。展望未来,持续的技术进步将为用户带来更多惊喜和便利。

Most people like

Find AI tools in YBX