本週的 Google I/O 開發者大會上,Google 發布了最新的人工智慧模型—Gemini 1.5 Flash。這款模型以速度和效率為優化重點,突破了人工智慧的界限,滿足開發者對於輕量、高效且強大的 AI 工具的需求。
Google DeepMind 的 CEO Demis Hassabis 強調了 Gemini 1.5 Flash 在多種應用中的卓越表現,包括摘要、聊天功能、圖像與視頻標題生成,以及從長文檔和電子表格中提取數據。這款新模型採用了「蒸餾」過程,將 Gemini 1.5 Pro 的關鍵知識與技能轉移至更緊湊的設計,在輕量架構與強大功能之間取得平衡。
儘管體積更小,Gemini 1.5 Flash 依然具備與 Pro 版本相同的多模態功能,擁有長達 100 萬個標記的上下文窗口,使其能夠在一次運算中分析最多 1500 頁文檔或超過 30,000 行程式碼,為開發者提供前所未有的便利。
Gemini 1.5 Flash 專為開發者量身定制,使他們能更快、更經濟地構建 AI 產品和服務。此外,Google 還對 Gemini 1.5 Pro 進行了升級,增強其編碼、推理和視聽分析能力。更令人振奮的是,Google 計劃在今年晚些時候將現有模型的上下文窗口擴展至 200 萬個標記,使其能夠同時處理 2 小時的視頻、22 小時的音頻、超過 60,000 行程式碼或 140 萬字的內容。
目前,Gemini 1.5 Flash 和 Pro 版本均可在 Google AI Studio 和 Vertex AI 中進行預覽。同時,Google 也發布了其開源模型的新版 Gemma 2。這些更新主要針對開發者和希望構建 AI 應用的用戶,對於普通消費者的直接收益則較為有限。
Gemini 1.5 Flash 的發布再次彰顯了 Google 在人工智慧領域的創新實力,為開發者提供了強大且靈活的工具,推動未來 AI 產品與服務的發展。