谷歌正式推出其最先进的生成式 AI 模型 Gemini,专为企业应用开发需求而设计。
上周发布的 Gemini 目前有三个版本:Ultra、Pro 和 Nano。今天的公告中,Pro 版本通过 API 向开发者开放,开发者可以在一定的使用限制内免费使用,详细信息请见最新的博客文章。
Gemini Pro for Developers:主要特点
开发者可以通过 Google AI Studio API 访问 Gemini Pro 的第一个版本,这为应用开发提供了一个基于网页的平台,以创建提示和获取 API 密钥。该版本支持 32K 的上下文窗口用于文本生成,并计划在未来扩展这一功能。
谷歌还推出了一个专用的 Gemini Pro Vision 多模态端点,接受文本和图像输入,提供文本输出。在 X 平台上,首席执行官 Sundar Pichai 强调了 Gemini API 的综合特性,包括函数调用、嵌入、语义检索、自定义知识基础和聊天功能。该 API 支持 38 种语言,覆盖 180 多个国家。
Gemini Pro 还将集成到 Vertex AI 中,这是谷歌云的端到端 AI 平台,包含工具、完全托管的基础设施及内置的隐私和安全功能。这项集成使开发者在需要时能够顺利过渡到托管环境。
公司希望收集开发者的反馈,以优化 Gemini Pro,并为明年推出更复杂的 Gemini Ultra 做准备。
免费访问(有使用限制)
目前,谷歌为 Gemini Pro 和 Gemini Pro Vision 提供免费使用,但每分钟请求限制为 60 次。这一限制同样适用于在 Vertex AI 上使用模型的开发者,而这一免费访问仅在明年正式推出前有效。值得注意的是,谷歌的免费配额比竞争对手大 20 倍,适用于大多数开发项目。
一旦服务全面可用,定价将基于使用情况,每 1,000 个字符或图像收费。具体而言,Gemini Pro 的输入价格设定为每 1K 字符 $0.00025,每张图片 $0.0025,而输出费用为每 1K 字符 $0.0005。
在 X 平台上,一些用户指出,谷歌按字符收费的定价模型明显高于竞争对手,如 OpenAI 通常按 token 收费,后者可以代表整个单词。
Vertex AI 的增强功能
随着 Gemini Pro 的发布,谷歌还更新了 Vertex AI,引入了最新的文本到图像扩散技术 Imagen 2。这次升级新增了生成各种创意和真实标志、徽章及字母商标的功能,同时改善了多语言文本渲染的效果。
此外,谷歌宣布通过 Vertex AI 向美国组织提供 MedLM,这是一个针对医疗行业微调的基础模型系列,该新产品建立在之前的 Med-PaLM 2 基础模型之上,预计即将推出基于 Gemini 的升级版本。