마이크로소프트, 서버리스 파인튜닝으로 Phi-3 소형 언어 모델 맞춤화 및 효율성 개선

마이크로소프트는 OpenAI의 주요 파트너로서 생성적 AI 분야에서 경쟁력을 유지하기 위한 조치를 취하고 있습니다. 오늘, 이 회사는 개발자가 자체 서버를 관리하지 않고도 Phi-3 소형 언어 모델을 세밀하게 조정할 수 있는 새로운 방법을 무료로 제공한다고 발표했습니다.

세밀한 조정은 특정 애플리케이션에 맞춰 AI 모델의 행동과 기능을 개선하는 과정입니다. 4월에 공개된 Phi-3는 30억 개의 파라미터로 구성된 모델로, 비용 효율적인 솔루션을 원하는 제3자 개발자를 위한 선택입니다. 많은 선도 모델보다 작지만, 마이크로소프트의 생성적 AI 부사장인 세바스티앵 뷔벡에 따르면 Phi-3는 OpenAI의 GPT-3.5와 유사한 성능을 제공합니다.

Phi-3 모델 가족은 다양한 파라미터 수와 문맥 길이를 가진 여섯 가지 변형으로 구성되어 있으며, 입력은 4,000에서 128,000개의 토큰까지 처리 가능하다. 가격은 1,000 입력 토큰당 $0.0003에서 $0.0005, 또는 백만 토큰당 $0.3에서 $0.9로 책정되어 OpenAI의 최신 GPT-4o 미니와 경쟁력을 갖추고 있습니다.

기업 사용을 목표로 하는 Phi-3는 편향과 독성을 완화하는 안전 장치를 갖추고 있습니다. 뷔벡은 특정 비즈니스 요구에 맞출 수 있는 적응력을 강조하며 "귀하의 데이터를 가져와 이 일반 모델을 세밀하게 조정하여 특화된 애플리케이션에서 뛰어난 성능을 달성할 수 있습니다"라고 말했습니다.

이전에는 개발자가 Microsoft Azure를 통해 자신의 서버를 설정하거나 로컬에서 모델을 실행해야 세밀한 조정을 수행할 수 있었습니다. 그러나 이제 마이크로소프트는 Azure AI 개발 플랫폼 내에 서버리스 "모델-서비스" 옵션을 출시했습니다. 개발자들은 이 서버리스 엔드포인트를 통해 Phi-3-small에 접근할 수 있어 AI 개발 프로세스가 간소화되었습니다.

이미지 입력을 처리할 수 있는 Phi-3-vision도 곧 서버리스 엔드포인트를 통해 제공될 예정입니다. 이러한 모델은 마이크로소프트의 Azure 플랫폼을 통해 접근할 수 있으며, 모델 맞춤화를 원하는 개발자는 제3자 데이터로 세밀한 조정이 가능한 Phi-3-mini 및 Phi-3-medium을 고려해야 합니다.

마이크로소프트는 Khan Academy와 같은 교육 플랫폼이 Azure OpenAI 서비스를 통해 Khanmigo for Teachers의 성능을 높이기 위해 세밀하게 조정된 Phi-3 모델을 이미 활용하고 있다고 강조했습니다.

서버리스 세밀 조정이 도입됨에 따라 Phi-3-mini-4k-instruct의 가격은 1,000 토큰당 $0.004(백만 토큰당 $4)부터 시작되며, 중간 모델의 가격은 공개되지 않았습니다.

이러한 움직임은 특히 OpenAI가 특정 API 사용자를 위해 하루 최대 200만 토큰까지 무료 세밀 조정을 발표한 상황에서 마이크로소프트를 기업 AI 개발자 유치의 강력한 경쟁자로 자리매김하게 합니다.

메타가 오픈 소스 Llama 3.1 패밀리를 출시하고 Mistral이 Mistral Large 2 모델을 소개하면서 세밀 조정이 가능한 AI 솔루션을 제공하기 위한 경쟁이 치열해지고 있습니다. AI 공급자들은 소형에서 대형에 이르는 다양한 모델 옵션을 통해 개발자를 유치하기 위해 노력하고 있습니다.

Most people like

Find AI tools in YBX