Google 推出了 Gemini 1.5 Flash,這是一款為可擴展性和高頻任務設計的緊湊型多模態模型。該模型擁有一百萬個標記的上下文窗口,現已通過 Google AI Studio 的 Gemini API 進入公眾預覽階段。此外,於二月推出的 Gemini 1.5 Pro 預計將獲得重大升級,將上下文窗口擴展至兩百萬個標記,從一百萬增加。感興趣的開發者需加入等候名單以獲取此更新。
Gemini 1.5 有哪些新特點?
Gemini 1.5 Flash 和 Gemini 1.5 Pro 針對不同需求進行優化。Gemini 1.5 Flash 強調輸出速度,非常適合需要快速響應的低延遲任務。相對而言,Gemini 1.5 Pro 則為較複雜的多步驟推理任務提供最佳化,表現與 Google 的大型 1.0 Ultra 模型相似。Google Labs 副總裁 Josh Woodward 指出,開發者應該選擇 Gemini 1.5 Flash 以應對需要迅速回應的任務,而 Gemini 1.5 Pro 更適合用於複雜的應用場景。
這種分層策略使開發者能夠根據自身需求選擇各種 AI 模型,打破了一刀切的做法。透過提供多樣化的能力,Google 進一步提升了 AI 驅動服務的用戶體驗。然而,對於某些開發者來說,Gemini 1.5 Flash 可能不會在足夠大的數據集上進行訓練。在這種情況下,升級至 Gemini 1.5 Pro 將是有利的選擇。
Gemini 模型系列包括從輕量級的 Gemma 和 Gemma 2 到 Gemini Nano、Gemini 1.5 Flash、Gemini 1.5 Pro 和 Gemini 1.0 Ultra。正如 Woodward 所言,「開發者可以根據他們的使用案例在這些模型之間進行切換」,同時保持多模態輸入能力和一致的後端體驗。
在 OpenAI 推出其競爭對手 GPT-4o 這款旨在廣泛用戶訪問的多模態大型語言模型(LLM)後,該公告隨即發佈,並包含桌面應用程式的支持。
兩款 Gemini 1.5 模型目前已在超過 200 個國家和地區的公眾預覽中提供,包括歐洲經濟區、英國和瑞士。