마이크로소프트, 일반 사용자를 위한 Phi-3 출시 및 멀티모달 소형 언어 모델 프리뷰 Phi-3-Vision 공개

마이크로소프트는 개발자들을 위해 Phi-3 경량 모델 가족의 접근성을 확대하며, 초기 발표 후 한 달 만에 이를 진행하고 있습니다. 이 모델 가족에는 Phi-3-medium, Phi-3-small, Phi-3-mini가 포함되어 있으며, 특히 Phi-3-mini는 이제 Azure AI에 통합되었습니다. 추가로, 마이크로소프트는 42억 개의 매개변수를 특징으로 하는 다중 모드 변형인 Phi-3-vision을 소개했습니다.

Phi-3 개요

마이크로소프트 리서치에 의해 개발된 Phi-3는 30억 개의 매개변수를 가진 강력한 언어 모델로, 더 큰 모델들과 비교해 비용을 절감하면서도 뛰어난 추론 능력을 제공합니다. 이는 Phi-1, Phi-1.5, Phi-2에 이어 마이크로소프트의 컴팩트 언어 모델의 네 번째 버전입니다.

AI 에이전트와 소형 모델

로컬에서 작동하거나 기기에서 사용할 수 있는 AI 솔루션에 대한 수요 증가로 인해 개발자들은 더 효율적이고 소형 모델을 탐색하고 있습니다. 마이크로소프트의 Phi-3 가족은 Phi-3-mini(38억 매개변수), Phi-3-small(70억 매개변수), Phi-3-medium(140억 매개변수) 등 세 가지 옵션을 제공합니다. 회사에 따르면, Phi-3는 더 경량화된 형식으로 OpenAI의 GPT-3.5와 동등한 성능을 보여줍니다.

Phi-3의 출시와 함께 PC에서 AI 기능이 도입될 예정입니다. 개발자들은 이제 이러한 변형을 활용하여 노트북, 모바일 기기 및 웨어러블 장치 전반에 걸쳐 AI 기능을 향상시킬 수 있습니다.

Phi-3-vision에 대한 인사이트

Phi-3 모델 외에도 마이크로소프트는 일반적인 시각적 추론 작업을 지원하는 Phi-3-vision을 발표했습니다. 이 모델은 42억 개의 매개변수를 가지고 있으며, 사용자들은 데이터 시각화나 특정 이미지를 질문하여 Phi-3-vision과 상호작용할 수 있습니다.

주목할 만한 점은 구글이 최근 개발자 회의에서 30억 개의 매개변수를 가진 경량 다중 모드 모델인 PaliGemma를 소개했다는 것입니다. AI가 다양한 입력 유형을 처리할 수 있는 능력은 개발자에게 매우 중요합니다. 경량 아키텍처의 효율성과 더 큰 언어 모델의 성능을 결합한 모델은 채택을 크게 향상시킬 수 있습니다. 현재 Phi-3-vision은 미리보기 단계에 있으며, 마이크로소프트는 일반 공개 일정에 대해 아직 발표하지 않았습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles