마이크로소프트는 30억 개 파라미터를 갖춘 강력한 언어 모델 Phi-3의 출시를 발표했습니다. Phi-3는 대형 모델과 비교할 수 있는 고급 추론 능력을 제공하면서 비용은 대폭 절감합니다. 마이크로소프트 리서치에서 개발한 이 모델은 Azure AI 플랫폼에서 제공되며, 기업들이 최신 자연어 처리 기술을 다양한 응용 프로그램에 활용할 수 있도록 돕습니다.
“중요한 점은, 우리가 훨씬 더 큰 모델과 경쟁할 수 있는 컴팩트한 모델을 보유하고 있으며, GPT-3.5의 성능에 근접하고 있다는 것입니다.”라고 마이크로소프트 생성 AI 부사장인 세바스티앙 뷔벡(Sébastien Bubeck)은 말했습니다. “우리가 이룬 발전은 초기 기대를 초월했습니다. 누구도 이러한 능력을 달성하기 위해 필요한 모델의 규모를 예상하지 못했습니다.”
Phi-3는 마이크로소프트의 소형 언어 모델 탐색의 최신 이정표입니다. 작년 Phi-1을 시작으로 Phi-1.5, Phi-2로 이어지는 Phi 시리즈는 10억에서 20억 파라미터 모델을 통해 코딩, 상식 추론, 자연어 벤치마크에서 뛰어난 성능을 보여주었습니다.
비용 효율적인 AI 솔루션
“고객이 가능한 것을 목격함에 따라 혁신의 방법을 찾고 있습니다.”라고 Azure AI 플랫폼의 기업 부사장 에릭 보이드(Eric Boyd)는 말했습니다. “Azure에서는 고객의 요구를 충족하는 생성 AI 애플리케이션 개발을 지원하고 있습니다. 우리는 혁신의 경계를 넓히면서 모든 가격대에서 최고 수준의 옵션을 제공할 것입니다.”
Phi-3는 OpenAI의 GPT-3.5와 유사한 기능을 가진 30억 파라미터 모델로, 비용은 적고 표준 하드웨어와 스마트폰에서도 실행 가능합니다. 이러한 파라미터 효율성의 발전은 구현 비용이 너무 비쌌던 기업들에게 변혁적인 AI 기회를 열어줍니다.
책임 있는 AI에 대한 약속
마이크로소프트는 Phi-3 개발에서 책임 있는 AI 원칙을 우선시했습니다. 모델의 훈련 데이터는 독성 및 편향에 대해 철저히 검토되었고, 추가적인 안전 장치가 마련되었습니다. 이러한 철저한 접근 방식은 특히 규제가 있는 분야의 기업들이 Phi-3의 고급 기능을 자신 있게 활용할 수 있게 합니다.
기술적 관점에서 Phi-3는 NVIDIA GPU에 최적화된 ONNX Runtime에서 작동하며, 여러 GPU나 머신에 분산 배포하여 처리량을 극대화할 수 있습니다. 효율적인 주의 메커니즘과 최적화된 수치 정밀도를 사용하는 이 모델은 상대적으로 컴팩트한 크기로 높은 성능을 제공합니다.
고급 자연어 AI로 기업 역량 강화
“소형 모델에서 이러한 기반 계층의 장점은 기업이 자신의 데이터로 조정하여 특정 분야에서 뛰어난 결과를 얻을 수 있다는 것입니다.”라고 뷔벡은 설명했습니다. “특수한 영역에서도 일반 지능은 여전히 중요합니다.”
Phi-3의 도입과 Azure AI 플랫폼에의 통합은 모든 규모의 기업이 대형 언어 모델의 기능을 보다 접근 가능하고 비용 효율적으로 사용할 수 있는 중대한 발전을 의미합니다. 조직들이 AI를 운영화하고 비구조적 데이터의 가치를 활용함에 따라, Phi-3와 같은 맞춤형 모델이 이러한 목표를 실현하는 데 필수적일 것입니다.