微软发布Phi-3供大众使用,并揭晓Phi-3-Vision:多模态小型语言模型预览

微软正在扩大对其Phi-3轻量级模型系列的访问权限,此举距其首次发布仅一个月。这一系列包括Phi-3-medium、Phi-3-small和Phi-3-mini,后者现已集成至Azure AI。此外,微软还推出了多模态变体Phi-3-vision,该模型具有42亿个参数。

Phi-3概述

Phi-3是由微软研究院开发的强大语言模型,拥有30亿个参数,旨在提供与大型模型相当的推理能力,同时降低使用成本。这是微软紧凑型语言模型的第四个版本,其前身为Phi-1、Phi-1.5和Phi-2。

AI代理与小型模型

随着对本地或设备上运行的AI解决方案需求的增加,开发者开始探索更高效的小型模型。微软的Phi-3系列提供了三个选项:Phi-3-mini(38亿参数)、Phi-3-small(70亿参数)和Phi-3-medium(140亿参数)。根据公司介绍,Phi-3在更轻量化的格式下展示了与OpenAI的GPT-3.5相当的性能。

Phi-3的发布正值PC即将推出AI功能之际。开发者现在可以利用这些变体来增强笔记本电脑、移动设备和可穿戴设备上的AI功能。

Phi-3-vision洞察

除了Phi-3模型外,微软还推出了Phi-3-vision,这一模型支持一般视觉推理任务,包括分析图表、图形和表格。其拥有42亿个参数,用户可以通过提问数据可视化或特定图像来与Phi-3-vision互动。

值得注意的是,谷歌在最近的开发者大会上也推出了其轻量级多模态模型PaliGemma,具有30亿参数,略少于微软的方案。

对开发者而言,AI处理多种输入类型的能力至关重要。一个结合轻量架构效率与大型语言模型性能的模型,有望显著提升采用率。

目前,Phi-3-vision仍处于预览阶段,微软尚未宣布其公开可用性。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles