微軟發布Phi-3供大眾使用，並揭曉Phi-3-Vision：多模態小型語言模型預覽

Home AI新聞微軟發布Phi-3供大眾使用，並揭曉Phi-3-Vision：多模態小型語言模型預覽

微軟近期擴大了對其Phi-3輕量級模型系列的開放，這是在首次公告近一個月後的舉措。此系列包括Phi-3-medium、Phi-3-small和Phi-3-mini，後者已整合至Azure AI。此外，微軟還推出了多模態變體Phi-3-vision，具備42億參數。

Phi-3概述

由微軟研究院開發，Phi-3是一款強大的30億參數語言模型，旨在提供與大型模型相媲美的推理能力，同時降低成本。這是微軟小型語言模型的第四版，之前的版本包括Phi-1、Phi-1.5和Phi-2。

AI代理與小型模型

隨著對本地運行情境或設備的AI解決方案需求增長，開發者越來越重視更高效且小型的模型。微軟的Phi-3系列提供三個選擇：Phi-3-mini（38億參數）、Phi-3-small（70億參數）和Phi-3-medium（140億參數）。根據微軟的說法，Phi-3在輕量格式中展現出與OpenAI的GPT-3.5相當的性能。

Phi-3的發布恰逢即將推出的PC AI能力，開發者現在可以利用這些變體提升筆記本電腦、移動設備和穿戴裝置的AI功能。

Phi-3-vision的見解

除了Phi-3模型外，微軟還推出了Phi-3-vision，支持一般的視覺推理任務，包括分析圖表、圖形和表格。擁有42億參數的Phi-3-vision，使用者可以透過詢問數據視覺化或具體圖像來互動。

值得注意的是，谷歌也在其最新的開發者大會上推出了輕量級多模態模型PaliGemma，擁有30億參數，稍微少於微軟的模型。AI處理多種輸入類型的能力對開發者而言至關重要，結合輕量架構效率與大型語言模型性能的模型，有望顯著提升採用率。

目前Phi-3-vision處於預覽階段，微軟尚未宣布其公開可用性。

釋放創造力：Qualcomm Snapdragon 開發套件 - 一款便攜式電腦，用於開發 Copilot+ 應用程式

微軟與可汗學院合作，為 K-12 教育工作者提供免費的 AI 輔導服務，並開發先進的 Phi-3 數學模型。