微軟推出可無伺服器化的 Phi-3 小型語言模型微調功能:提升客製化和效率

微軟作為OpenAI的重要合作夥伴,正積極採取措施,確保在生成式AI領域保持競爭力。今天,該公司推出了一種無需開發人員管理自己伺服器的新方法,用於微調其Phi-3小型語言模型,並目前免費提供。

微調是自訂AI模型以提高其在特定應用中的行為和能力的過程。Phi-3於四月揭幕,是一個擁有30億參數的模型,旨在為尋求開發應用的第三方開發人員提供經濟實惠的選擇。雖然其規模小於許多領先模型,如Meta的Llama 3.1(擁有4050億參數),但微軟生成AI副總裁Sébastien Bubeck表示,Phi-3的性能與OpenAI的GPT-3.5相當。

Phi-3模型系列包含六個變體,參數數量和上下文長度各異,可容納從4,000到128,000個token的輸入。定價從每1,000個輸入token $0.0003到$0.0005不等,或每百萬token $0.3到$0.9,這使其在價格上具備與OpenAI的新型GPT-4o mini競爭的優勢。

Phi-3專注於企業使用,配備了降低偏見和毒性影響的安全措施。Bubeck之前強調,其可根據特定業務需求進行調整,並表示:“您可以引入自己的數據,微調這個通用模型以在專用應用上實現卓越性能。”

之前,開發人員必須通過Microsoft Azure建立自己的伺服器或在本地運行模型以進行微調。然而,微軟現在在其Azure AI開發平台中推出了一個公共的「無伺服器模型服務」(Models-as-a-Service)選項。開發人員可以通過這個無伺服器端點訪問Phi-3-small,簡化了AI開發的流程。

Phi-3-vision模型能夠處理圖像輸入,也將很快在無伺服器端點上提供。雖然這些模型可通過微軟的Azure平台獲得,但希望自訂模型的開發人員應考慮使用Phi-3-mini和Phi-3-medium,這兩者支持用第三方數據進行微調,以打造量身定制的AI體驗。

微軟指出,Khan Academy等教育平台已經利用微調過的Phi-3模型來提升其基於Azure OpenAI Service的Khanmigo for Teachers的性能。

無伺服器微調的進展帶來了Phi-3-mini-4k-instruct的定價結構,起價為每1,000個token $0.004(每百萬token $4),而中型模型的定價仍未透露。

此舉使微軟在吸引企業AI開發人員方面成為強勁的競爭者,尤其是在OpenAI最近宣佈為GPT-4o mini提供免費微調服務,特定API用戶每日可獲得最多200萬token的背景下。

隨著Meta釋出開源的Llama 3.1系列和Mistral推出Mistral Large 2模型——兩者都具備微調能力——顯而易見,為企業開發提供引人注目的AI解決方案的競爭正在加劇。AI供應商正努力以多種模型選項吸引開發人員,從小型到大型應有盡有。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles