微软发布Phi-3供大众使用，并揭晓Phi-3-Vision：多模态小型语言模型预览

Home AI News CN 微软发布Phi-3供大众使用，并揭晓Phi-3-Vision：多模态小型语言模型预览

微软正在扩大对其Phi-3轻量级模型系列的访问权限，此举距其首次发布仅一个月。这一系列包括Phi-3-medium、Phi-3-small和Phi-3-mini，后者现已集成至Azure AI。此外，微软还推出了多模态变体Phi-3-vision，该模型具有42亿个参数。

Phi-3概述

Phi-3是由微软研究院开发的强大语言模型，拥有30亿个参数，旨在提供与大型模型相当的推理能力，同时降低使用成本。这是微软紧凑型语言模型的第四个版本，其前身为Phi-1、Phi-1.5和Phi-2。

AI代理与小型模型

随着对本地或设备上运行的AI解决方案需求的增加，开发者开始探索更高效的小型模型。微软的Phi-3系列提供了三个选项：Phi-3-mini（38亿参数）、Phi-3-small（70亿参数）和Phi-3-medium（140亿参数）。根据公司介绍，Phi-3在更轻量化的格式下展示了与OpenAI的GPT-3.5相当的性能。

Phi-3的发布正值PC即将推出AI功能之际。开发者现在可以利用这些变体来增强笔记本电脑、移动设备和可穿戴设备上的AI功能。

Phi-3-vision洞察

除了Phi-3模型外，微软还推出了Phi-3-vision，这一模型支持一般视觉推理任务，包括分析图表、图形和表格。其拥有42亿个参数，用户可以通过提问数据可视化或特定图像来与Phi-3-vision互动。

值得注意的是，谷歌在最近的开发者大会上也推出了其轻量级多模态模型PaliGemma，具有30亿参数，略少于微软的方案。

对开发者而言，AI处理多种输入类型的能力至关重要。一个结合轻量架构效率与大型语言模型性能的模型，有望显著提升采用率。

目前，Phi-3-vision仍处于预览阶段，微软尚未宣布其公开可用性。

释放创意：高通Snapdragon开发套件 - 一款紧凑型PC，专为Copilot+应用开发而设计

微软携手可汗学院，为K-12教育工作者提供免费人工智能辅导，并开发先进的Phi-3数学模型