谷歌发布Gemini 1.5 Flash：创新高效的多模态模型，拥有1M上下文窗口，速度卓越

Home AI News CN 谷歌发布Gemini 1.5 Flash：创新高效的多模态模型，拥有1M上下文窗口，速度卓越

谷歌推出了Gemini 1.5 Flash，这是一个紧凑的多模态模型，旨在支持可扩展性和高频任务。该模型拥有一百万个 token 的上下文窗口，目前已通过谷歌人工智能工作室的Gemini API进行公众预览。

此外，早在二月份发布的Gemini 1.5 Pro，将获得重大升级，其上下文窗口将扩展至两百万个 token，较之前的一百万有所增加。有意开发者需要加入候补名单，以获取这一更新。

Gemini 1.5 有哪些新功能？

Gemini 1.5 Flash 和 Gemini 1.5 Pro 旨在满足不同需求。Gemini 1.5 Flash 优先考虑输出速度，非常适合要求低延迟的快速任务。相对而言，Gemini 1.5 Pro 则优化了更复杂的多步骤推理任务，性能与谷歌的1.0 Ultra大模型相似。谷歌实验室副总裁乔什·伍德沃德表示，开发者应对快速响应任务选择Gemini 1.5 Flash，而对于复杂应用则更适合选择Gemini 1.5 Pro。

这种分层策略使开发者能够从多种AI模型中进行选择，避免了“一刀切”的方法。通过提供不同的能力，谷歌提升了人工智能服务的用户体验。然而，某些开发者可能会发现，Gemini 1.5 Flash 的训练数据集不足。在这种情况下，升级到Gemini 1.5 Pro 可能会更有利。

Gemini 模型系列包括从轻量级的 Gemma 和 Gemma 2 到 Gemini Nano、Gemini 1.5 Flash、Gemini 1.5 Pro，以及 Gemini 1.0 Ultra。伍德沃德指出，“开发者可以根据具体用例在不同的模型之间切换”，同时保持多模态输入能力和一致的后端体验。

这一消息公布不久后，OpenAI也推出了其竞争对手GPT-4o，这是一个面向广泛用户的多模态大型语言模型（LLM），还包括桌面应用程序。

目前，Gemini 1.5 的两个版本在200多个国家和地区公开预览，包括欧洲经济区、英国和瑞士。

OpenAI发布免费的GPT-4o，谁还需要支付ChatGPT Plus？

MidReal发布生成式AI“选择你自己的冒险”平台：探索交互式故事体验