微軟發布Phi-3供大眾使用,並揭曉Phi-3-Vision:多模態小型語言模型預覽

微軟近期擴大了對其Phi-3輕量級模型系列的開放,這是在首次公告近一個月後的舉措。此系列包括Phi-3-medium、Phi-3-small和Phi-3-mini,後者已整合至Azure AI。此外,微軟還推出了多模態變體Phi-3-vision,具備42億參數。

Phi-3概述

由微軟研究院開發,Phi-3是一款強大的30億參數語言模型,旨在提供與大型模型相媲美的推理能力,同時降低成本。這是微軟小型語言模型的第四版,之前的版本包括Phi-1、Phi-1.5和Phi-2。

AI代理與小型模型

隨著對本地運行情境或設備的AI解決方案需求增長,開發者越來越重視更高效且小型的模型。微軟的Phi-3系列提供三個選擇:Phi-3-mini(38億參數)、Phi-3-small(70億參數)和Phi-3-medium(140億參數)。根據微軟的說法,Phi-3在輕量格式中展現出與OpenAI的GPT-3.5相當的性能。

Phi-3的發布恰逢即將推出的PC AI能力,開發者現在可以利用這些變體提升筆記本電腦、移動設備和穿戴裝置的AI功能。

Phi-3-vision的見解

除了Phi-3模型外,微軟還推出了Phi-3-vision,支持一般的視覺推理任務,包括分析圖表、圖形和表格。擁有42億參數的Phi-3-vision,使用者可以透過詢問數據視覺化或具體圖像來互動。

值得注意的是,谷歌也在其最新的開發者大會上推出了輕量級多模態模型PaliGemma,擁有30億參數,稍微少於微軟的模型。AI處理多種輸入類型的能力對開發者而言至關重要,結合輕量架構效率與大型語言模型性能的模型,有望顯著提升採用率。

目前Phi-3-vision處於預覽階段,微軟尚未宣布其公開可用性。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles