今天,Google DeepMind 宣布推出 Gemma,這是一款新的開源人工智慧模型,提供 2B 和 7B 參數選項。這些模型基於最近推出的 Gemini 模型所採用的研究和技術。
Gemma 將提供預訓練及指令調整版本,並附帶寬鬆的商業授權和負責任的生成 AI 工具包。此外,Google DeepMind 還提供與主要框架兼容的推論和監督微調(SFT)工具鏈,包括 JAX、PyTorch 和通過原生 Keras 3.0 的 TensorFlow。開發者可以使用現成的 Colab 和 Kaggle 筆記本,並且 Gemma 與 Hugging Face、MaxText 和 NVIDIA NeMo 相容。預訓練和指令調整模型可以在筆記本電腦、工作站或 Google Cloud 上運行,並可在 Vertex AI 和 Google Kubernetes Engine 上部署。
NVIDIA 也與 Google 合作,加強在所有 NVIDIA AI 平台上的優化,包括本地 RTX AI PC,以提升 Gemma 的性能。
Google 開發者 X 的副總裁兼總經理 Jeanine Banks 指出,Gemma 模型代表了 Google 持續對開源技術在 AI 開發中的承諾,並建立於像 TensorFlow、JAX 及 PaLM2 和 AlphaFold 這樣的工具之上。她強調,在 Gemini 模型開發過程中獲得的洞見顯示,開發者在工作流程的不同階段常常同時使用開源模型和 API。Banks 表示:「我們希望成為 API 和開源模型的唯一提供者,為我們的社群提供最廣泛的能力。」
Google DeepMind 的產品管理總監 Tris Warkentin 宣布,公司將發布全面的基準評估,與其他模型一起評估 Gemma,這些評估將在 OpenLLM 排行榜上公開。「我們正與 NVIDIA 和 Hugging Face 合作,確保所有公共基準都針對這些模型進行測試。」他表示,對於在開發過程中採取透明且以社區為中心的方法感到自豪。
Gemma 被描述為「負責任的設計。」Warkentin 強調,這些模型經過全面評估以確保安全性。Google DeepMind 的部落格詳細說明了 Gemma 與 AI 原則的一致性,採用自動化技術過濾訓練數據集中的個人信息,並使用來自人類反饋的強化學習(RLHF)來促進負責任的行為。包括人工紅隊測試和自動對抗測試在內的嚴格評估已進行,以評估模型的風險輪廓。
Warkentin 還強調開放生態系統在培育負責任 AI 方面的重要性。他表示:「我們相信來自全球開發者和研究人員的多元觀點對有效的反饋和增強的安全系統至關重要。整合這些反饋與社區的溝通是此項目價值的關鍵。」