谷歌推出了Gemini 1.5 Flash,这是一个紧凑的多模态模型,旨在支持可扩展性和高频任务。该模型拥有一百万个 token 的上下文窗口,目前已通过谷歌人工智能工作室的Gemini API进行公众预览。
此外,早在二月份发布的Gemini 1.5 Pro,将获得重大升级,其上下文窗口将扩展至两百万个 token,较之前的一百万有所增加。有意开发者需要加入候补名单,以获取这一更新。
Gemini 1.5 有哪些新功能?
Gemini 1.5 Flash 和 Gemini 1.5 Pro 旨在满足不同需求。Gemini 1.5 Flash 优先考虑输出速度,非常适合要求低延迟的快速任务。相对而言,Gemini 1.5 Pro 则优化了更复杂的多步骤推理任务,性能与谷歌的1.0 Ultra大模型相似。谷歌实验室副总裁乔什·伍德沃德表示,开发者应对快速响应任务选择Gemini 1.5 Flash,而对于复杂应用则更适合选择Gemini 1.5 Pro。
这种分层策略使开发者能够从多种AI模型中进行选择,避免了“一刀切”的方法。通过提供不同的能力,谷歌提升了人工智能服务的用户体验。然而,某些开发者可能会发现,Gemini 1.5 Flash 的训练数据集不足。在这种情况下,升级到Gemini 1.5 Pro 可能会更有利。
Gemini 模型系列包括从轻量级的 Gemma 和 Gemma 2 到 Gemini Nano、Gemini 1.5 Flash、Gemini 1.5 Pro,以及 Gemini 1.0 Ultra。伍德沃德指出,“开发者可以根据具体用例在不同的模型之间切换”,同时保持多模态输入能力和一致的后端体验。
这一消息公布不久后,OpenAI也推出了其竞争对手GPT-4o,这是一个面向广泛用户的多模态大型语言模型(LLM),还包括桌面应用程序。
目前,Gemini 1.5 的两个版本在200多个国家和地区公开预览,包括欧洲经济区、英国和瑞士。