谷歌推出了最新版本的对话人工智能系统——Gemini 1.5,显著提升了效率、性能和长文本推理能力。在谷歌人工智能负责人Demis Hassabis的博文中,介绍了该系统的关键架构改进,使Gemini 1.5 Pro在消耗更少计算资源的情况下,与公司的最大模型Gemini 1.0 Ultra的性能相当。Gemini 1.0 Ultra刚刚在上周发布。
最引人注目的创新是引入了百万标记上下文窗口,这标志着长文本理解的重大突破。标准的Gemini模型可以在128,000个标记的上下文中进行分析,而百万标记的升级使Gemini 1.5能够在生成响应前处理大量连续信息。
这个百万标记的上下文窗口使得长文本推理成为可能。谷歌CEO Sundar Pichai展示了Gemini 1.5的能力,包括总结阿波罗11号任务的完整转录文本,或分析一部44分钟的巴斯特·基顿无声电影。Hassabis指出,扩展的上下文使Gemini 1.5能够无缝地分析、分类和总结大量内容。初步结果表明,尽管上下文扩大,系统性能依然强劲。
至于百万标记版本的公开发布时间仍不确定,谷歌正通过其Vertex AI平台向部分开发者和企业用户提供有限预览。
此次发布也标志着谷歌最近将其对话AI从Bard重命名为Gemini,并推出了利用Ultra 1.0模型的付费Gemini Advanced层级,Gemini被视为OpenAI的ChatGPT Plus的竞争者。Hassabis提到,Gemini 1.5的效率提升将使谷歌团队能够“以前所未有的速度迭代、训练和交付更先进的Gemini版本。”
Pichai强调了谷歌在负责任地开发Gemini方面的承诺,始终遵循其人工智能原则。谷歌已对Gemini 1.5进行了广泛的伦理和安全测试,重点关注内容安全和代表性。
自从去年推出ChatGPT以来,对话AI的进步速度显著加快。专家们认为,这种变化归因于降低的训练成本和谷歌的稀疏门控混合专家架构等创新,这加速了新版本的快速开发。
通过Gemini 1.5,谷歌旨在巩固其在人工智能领域的领导地位。当前的紧迫问题是,这些先进的长文本推理能力何时会整合到谷歌的消费产品中。