Google正式推出其備受期待的下一代大型語言模型Gemini,並聲稱這是其迄今為止開發的最大和“最強大”的模型。在漫長的揣測之後,該公司發表了一篇博客文章,詳細介紹了該模型的功能,並透露Gemini有三個變體:Ultra、Pro和Nano。這種多樣性使其能夠在移動設備和大型數據中心中有效運作。
從今天開始,Gemini將用於各種解決方案,包括 Bard 聊天機器人,後者最初配備了 Gemini Pro 模型,並將以英語提供。Google聲稱這將顯著提升Bard的推理和理解能力。展望未來,公司計劃於2024年初推出 Bard Advanced,雖然這一版本的細節仍然稀少,但已提到將從 Gemini Ultra 開始提供“高級模型和功能”的訪問權限。
新的 Pixel 8 Pro 將成為第一款能夠運行 Gemini Nano 的智能手機。在新的一年中,使用者將能夠獲得令人興奮的新功能,如 Recorder 應用中的摘要功能,以及Gboard中針對WhatsApp的Smart Reply的開發者預覽。此外,Gemini將整合進Google Ads、Chrome和Duet AI,並有更多功能將在其多樣化產品系列中推出。值得注意的是,Google指出其在搜尋中的性能已獲得提升,改善了搜尋生成體驗(SGE)。
雖然博客文章未提及與Makersuite功能的整合,但先前的洩露暗示 Google's 網絡開發平台將利用Gemini的生成能力。Gemini最初由Google首席執行官Sundar Pichai在I/O 2023事件上揭晓,旨在在迅速演變的AI領域建立競爭優勢。
從12月13日起,開發人員和企業客戶可以通過Vertex AI或Google AI Studio的Gemini API訪問Gemini Pro,Google的免費基於網絡的開發工具。Gemini Ultra將在2024年初提供給特定組織,然後再擴展至更多企業客戶。對於希望開發基於Gemini應用程序的Android開發者,可以通過Android AICore報名參加Nano變體的早期預覽。
Gemini最初在五月的公司活動中宣布,但自那以來大多處於保密狀態。作為一個領先的前沿模型,它優先考慮大型語言模型的基礎進展,這也是最近的AI安全峰會中的重要議題。儘管Google計劃在本週的私人活動中展示這一模型,但由於處理非英語查詢的挑戰,這些演示被取消。然而,仍對未具名的商業夥伴進行了非公開的展示。
在公司内部,Google的高層領導表達出強烈的願望,希望Gemini能與OpenAI的ChatGPT抗衡,強調及早發布的緊迫性,以維持競爭優勢。此外,隨著Microsoft的AI Copilot在集成多種OpenAI技術的生產力軟件中的顯著進展,Google亦希望保持其創新步伐。
在硬體進步方面,Google使用其專有的TPU晶片對Gemini進行了訓練。隨著該模型的推出,還宣布了名為Cloud TPU v5p的新AI加速器。這些最新晶片在大型語言模型的訓練上比前一代TPU v4快2.8倍,並且據報導比現有的Cloud TPU v5e更強大。
此外,Google Cloud還推出了其AI超級電腦,這是一種專門設計用於增強AI訓練和優化的突破性超級電腦架構。這一先進基礎設施滿足了生成AI應用日益增長的計算需求,提供了一個集成的硬體、軟體、機器學習框架和消費模式的系統。
要利用Cloud TPU v5p或訪問新的AI超級電腦,企業需與指定的Google Cloud客戶經理聯繫,以確保他們能為商業需求利用這些尖端技術。