在最近的谷歌开发者大会 Google I/O 上,谷歌公司重点展示了其人工智能(AI)技术,提及“AI”超过120次。为了帮助您了解此次活动中发布的AI产品和功能,以下是2024年 Google I/O 的主要亮点。
搜索中的生成式 AI
谷歌计划在搜索结果中引入生成式 AI,以提升信息组织效率。当用户寻找灵感,尤其是在旅行规划时,搜索结果页面将包括AI生成的评论摘要、社交媒体讨论和精心策划的建议列表。未来,这些AI增强的结果还将扩展到餐饮选择、食谱、电影和书籍等领域。
Astra项目与Gemini Live
谷歌正在增强其AI聊天机器人Gemini,并推出一种新的交互体验——Gemini Live。用户将能够通过智能手机与Gemini进行语音聊天,并实时调整提问。这项技术使Gemini可以利用手机摄像头了解用户的周围环境,识别社区或物体。这一创新能力源自Astra项目,旨在实现AI驱动的实时理解。
谷歌Veo
谷歌推出了一款名为Veo的新工具,能够根据文本提示制作约一分钟的1080p视频。Veo可以捕捉多种视觉风格,并理解摄像机运动和效果,从而生成高度逼真的视频。此外,Veo还具有遮罩功能,可以将静态图像转化为动态视频。
“问照片”功能
谷歌照片推出了一项名为“问照片”的新功能,使用户能够使用自然语言搜索自己的照片库。此功能由Gemini支持,允许进行复杂搜索,例如从特定地点提取最佳照片,预计在今年夏季上线。
Gmail中的Gemini
Gmail用户将很快能够使用Gemini来搜索、总结和草拟电子邮件。用户可以指示Gemini提取并组织邮件中的关键信息,包括PDF附件,从而更方便地了解学校动态或管理收据。
通话中的欺诈检测
谷歌预览了一项新功能,利用Gemini Nano在电话通话中实时检测潜在的欺诈活动。这一功能将包含在即将发布的Android版本中,能够识别与欺诈相关的对话模式。
AI辅助可及性
谷歌通过生成式AI提升了TalkBack无障碍功能,为视觉障碍用户提供物体的听觉描述。TalkBack将自动生成图像描述,大大改善视觉障碍用户的无障碍体验。
这些创新反映了谷歌在AI领域的积极进取,预示着未来将为用户提供更智能、更便捷的体验。