Google Gemini Pro:即將推出,專為企業和開發者設計

谷歌正在推出其最新創新產品——Gemini模型,為企業和開發者提供其強大大型語言能力的首度探索,通過一個可用的API介面。Gemini分為三個尺寸:Ultra、Pro 和 Nano。從今天開始,開發者可以通過谷歌的免費網頁開發工具AI Studio(前身為Makersuite)訪問Gemini Pro API,而企業則可以通過谷歌雲的Vertex AI平台進行集成,快速創建應用程序。

谷歌宣布將根據用戶反饋在接下來幾週內進一步完善Gemini Pro。公司在最近的博客文章中指出:“我們期待開發者和企業用Gemini創造出創新的應用。”目前,Gemini Pro 是谷歌的對話AI Bard 的核心,旨在與ChatGPT展開競爭。初始版本的一個關鍵特徵是其32,000個token的上下文窗口,能處理約5,333字。而相比之下,OpenAI的GPT-4 Turbo可處理高達128,000個token。然而,Gemini Pro的未來版本有望大幅擴展這一能力。

Gemini Pro的功能支持38種語言、函數調用、嵌入、語義檢索和自定義知識基礎。目前,該API僅支持文本輸入和輸出。然而,一個名為Gemini Pro Vision的多模態端點已經啟用,能接受文本和視覺輸入(如圖像和視頻),並根據這些內容生成文本輸出。

目前,Gemini Pro API免費使用,但限制為每分鐘最多60次查詢。隨著即將推出的按需付費版本,使用限制將減少,並且谷歌形容其價格結構為“具有競爭力”。Gemini Pro的定價設為每千個字符0.00025美元,每幅圖像0.0025美元,而生成的輸出為每千個字符0.0005美元。免費版本的輸入和輸出將被谷歌利用以改進其產品,付費版本的數據則將保持私密。

除了Gemini Pro外,谷歌還在擴展其Vertex平台,推出新模型,包括最新的AI圖像生成模型Imagen 2,這是一種先進的文本到圖像擴散模型,能生成高質量圖像和商業標誌,並能以多種語言渲染文本。

另一個重要新增功能是MedLM,這是一套專為醫療行業精調的基礎模型。MedLM基於Med-PaLM 2模型,旨在用於醫療記錄和回答健康相關問題。目前,這個模型僅面向美國的Vertex用戶,未來計劃擴大其可用性。谷歌還計劃不久後在MedLM套件中引入基於Gemini的模型。

最後,針對開發者的Duet AI工具現在已全面推出。這個協作工具幫助開發者簡化應用程序構建流程,並可集成到各種谷歌雲服務中,用於代碼生成和聊天輔助。在接下來幾週內,Gemini將與Duet AI進行整合,這也將拓展到安全運營,提升防守者在統一的SecOps平台上的協作。

憑藉這些創新工具,谷歌正在鋪設AI驅動應用的新時代,承諾在各行各業提升生產力、創造力和安全性。

Most people like

Find AI tools in YBX