微软作为OpenAI的重要合作伙伴,正采取措施确保在生成式人工智能领域的竞争力。今天,微软推出了一种新的 fine-tuning(微调)方法,使开发者无需管理自己的服务器即可对Phi-3小型语言模型进行优化,并且该服务最初是免费的。
微调是定制人工智能模型的过程,旨在提升其在特定应用场景下的表现与能力。Phi-3于四月份发布,是一个拥有30亿参数的模型,旨在为希望构建应用程序的第三方开发者提供一种经济高效的选择。尽管其参数数量小于许多领先模型,例如拥有4050亿参数的Meta公司Llama 3.1,微软的生成式人工智能副总裁Sébastien Bubeck表示,Phi-3的性能与OpenAI的GPT-3.5相比并毫不逊色。
Phi-3模型系列包括六个变体,参数数量和上下文长度各不相同,可处理4,000至128,000个标记的输入。定价从每1,000个输入标记0.0003美元到0.0005美元不等,或每百万标记0.3美元到0.9美元,具有竞争力,尤其是与OpenAI更新的GPT-4o mini相比。
针对企业用户,Phi-3配备了防范偏见和有害内容的保护机制。Bubeck曾强调其适应性,表示:“你可以输入自己的数据,并微调该通用模型,以在特定应用中获得出色的性能。”
此前,开发者需要通过Microsoft Azure自行设置服务器或在本地运行模型进行微调。然而,微软如今在其Azure AI开发平台上推出了公共的“无服务器模型即服务”选项,开发者可以通过这一无服务器端点访问Phi-3-small,从而简化人工智能开发过程。
处理图像输入的Phi-3-vision也将在无服务器端点上推出。虽然这些模型可通过微软的Azure平台访问,但希望定制模型的开发者应关注Phi-3-mini和Phi-3-medium,这些模型支持使用第三方数据进行微调,以实现个性化的人工智能体验。
微软指出,像Khan Academy这样的教育平台已经利用微调的Phi-3模型来提升Khanmigo for Teachers的性能,该功能由Azure OpenAI服务支持。
无服务器微调的推出伴随了Phi-3-mini-4k-instruct的定价结构,起价为每1,000个标记0.004美元(每百万标记4美元),但中型模型的定价尚未披露。
这一举措使微软在吸引企业人工智能开发者方面形成强劲竞争力,尤其考虑到OpenAI最近宣布,为特定API用户提供免费的GPT-4o mini微调,每天可使用高达200万个标记。
随着Meta发布开源的Llama 3.1系列和Mistral推出Mistral Large 2模型(均支持微调),可见为企业开发提供令人信服的人工智能解决方案的竞争正在加剧。各大人工智能供应商正努力为开发者提供从小型到大型的多型号选项。