微軟宣布推出Phi-3,這是一款擁有30億參數的強大語言模型,具備與更大型模型相媲美的高級推理能力,但成本明顯降低。由微軟研究院開發的Phi-3將在Azure AI平台上提供,幫助企業利用尖端自然語言處理技術進行各種應用。
微軟生成式AI副總裁Sébastien Bubeck表示:“重要的是,我們擁有一個緊湊的模型,其能力媲美更大型的模型,接近GPT-3.5的表現。我們的進展超出了初期預期,沒有人能預見實現這些功能所需的規模。”
Phi-3是微軟探索緊湊型語言模型的新里程碑。自去年推出Phi-1以來,接著是Phi-1.5和Phi-2,Phi系列在編碼、常識推理和自然語言基準測試中表現出色,模型參數範圍從10億到20億不等。
企業的高性價比AI解決方案
Azure AI平台的企業副總裁Eric Boyd表示:“當客戶目睹可能性後,他們熱切尋求創新方法。在Azure上,我們促進生成式AI應用的開發,以滿足客戶需求。我們將始終提供最先進的模型,持續推進創新邊界,同時在每個價位提供一流選擇。”
借助Phi-3,微軟設計了一個靈活的30億參數模型,能夠接近OpenAI的GPT-3.5等領先模型的能力,但成本僅為其一小部分,並且足夠適應在標準硬體甚至智慧手機上運行。這一參數效率的突破為企業開啟了先前無法承擔的轉型AI機會。
對負責任AI的承諾
微軟在Phi-3的開發中優先考慮了負責任AI原則。該模型的訓練數據經過仔細篩查,以避免毒性和偏見,並附加了額外的安全措施。這一謹慎的方法使企業,特別是受監管行業能夠自信地利用Phi-3的高級功能。
從技術角度來看,Phi-3運行於優化NVIDIA GPU的ONNX Runtime,支持在多個GPU或機器上進行分佈式部署,以最大化吞吐量。其架構採用高效的注意力機制和優化的數值精度,以相對緊湊的模型大小提供高性能。
利用先進自然語言AI賦能企業
Bubeck解釋道:“在較小模型中的基礎層優勢在於,企業可以用自己的數據進行微調,在特定領域實現卓越效果。即使是在專業領域,通用智能仍然至關重要。”
Phi-3的推出及其在Azure AI平台中的集成,標誌著在為各種規模企業提供大型語言模型能力的可及性及成本效益方面取得重大進展。隨著組織努力使AI落地,並挖掘非結構化數據的價值,像Phi-3這樣的定制模型將在實現這一目標中發揮至關重要的作用。