OpenAI, 비용 효율적인 GPT-4o 미니 모델을 AI 애플리케이션을 위해 출시하다
7월 19일, OpenAI는 가장 비용 효율적인 소형 모델인 GPT-4o 미니 모델을 공식 발표했습니다. 이 모델은 GPT-3.5 Turbo를 대체하도록 설계되었으며, Claude 3 Haiku와 Gemini 1.5 Flash와 경쟁하고 있습니다. AI 애플리케이션 관련 비용을 크게 줄일 것으로 기대됩니다.
MMLU 벤치마크에서 82%를 기록하고 LMSYS 채팅 점수에서 GPT-4를 능가한 GPT-4o 미니는 상업적 가격으로 입력 토큰 100만 개당 0.15달러, 출력 토큰 100만 개당 0.60달러를 제공합니다. 이는 GPT-3.5 Turbo보다 60% 이상 저렴합니다.
이 모델은 API를 통해 텍스트 및 시각적 입력을 지원하며, 향후 텍스트, 이미지, 비디오 및 오디오로의 확장 계획이 있습니다. 128K 토큰의 컨텍스트 윈도우와 2023년 10월까지 업데이트된 지식을 갖춘 GPT-4o 미니는 GPT-4o와 공유되는 향상된 토크나이저로 인해 비영어 텍스트 처리의 효율성이 높아졌습니다.
텍스트 지능 및 다중 모드 추론의 학문적 벤치마크에서 GPT-4o 미니는 GPT-3.5 Turbo 및 기타 소형 모델을 초월하여 GPT-4o와 동일한 언어 범위를 지원합니다. 고급 기능 호출 기능은 데이터를 검색하거나 외부 시스템과 상호작용하는 애플리케이션 개발을 간소화하여 긴 컨텍스트 쿼리 처리 능력을 향상시킵니다.
GPT-4o 미니는 여러 주요 벤치마크에서 뛰어난 성능을 보입니다:
- 추론 작업: 82.0% 점수로 Gemini Flash(77.9%)와 Claude Haiku(73.8%)를 초과
- 수학 및 코딩 기술: MGSM 수학 추론 테스트에서 87.0%, HumanEval 코딩 성능에서 87.2%를 기록하여 Gemini Flash와 Claude Haiku를 모두 초과
- 다중 모드 추론: MMMU 평가에서 59.4%로 경쟁자를 능가
안전성 면에서도 GPT-4o 미니는 GPT-4o와 동일한 안전 조치를 통합하고 있습니다. OpenAI는 자동 및 수동 평가를 통해 철저한 검토를 수행하며, 70명 이상의 외부 전문가와 협력하여 잠재적 위험을 식별하고 완화하여 모델의 안전성을 향상시켰습니다.
현재 GPT-4o 미니는 Assistant API, Chat Completions API 및 Batch API를 통해 접근할 수 있으며, 개발자는 적절한 요금으로 액세스를 취득할 수 있습니다. 지금부터 GPT-4o 미니는 ChatGPT의 무료, Plus, 및 Team 사용자에게 제공되며, 엔터프라이즈 사용자는 다음 주에 접근할 예정입니다.