OpenAI는 어제 기술 커뮤니티를 놀라게 하며 "Strawberry" 또는 GPT-5가 아닌 새로운 추론 대형 언어 모델(LM) 가족인 "o1"을 공개했습니다. o1 모델은 과학, 기술, 공학 및 수학(STEM) 작업에서 높은 성능과 정확성을 제공하도록 설계되었습니다.
현재 사용 가능한 두 가지 모델은 o1-preview와 저사양의 o1-mini입니다. 이 모델들은 ChatGPT Plus 사용자와 OpenAI의 유료 API를 이용하는 개발자들이 액세스할 수 있어, 기존 애플리케이션에 통합하거나 새로운 애플리케이션을 개발하는 데 활용할 수 있습니다.
향상된 추론 능력
OpenAI의 API 기술 책임자인 미셸 포크라스는 o1 모델이 고급 추론 기술을 활용한다고 밝혔습니다. 이들은 전략을 조정하고 실수에서 배우며, 철저한 인지 과정을 거칩니다. 테스트에서 이 모델들은 어려운 기준에서 박사 과정 학생들과 비슷한 성과를 보였다고 합니다.
OpenAI의 니쿤드 한다는 o1 모델이 추론 관련 작업에서 GPT 시리즈를 크게 능가한다고 강조했습니다.
개발자를 위한 주요 정보
- 텍스트 전용 출력: 현재 두 모델 모두 텍스트 입력 및 출력에 제한되어 있어 이미지나 파일 분석과 같은 다중 모달 작업에는 적합하지 않습니다. 이러한 필요가 있는 경우 GPT-4o가 추천됩니다.
- 지식 컷오프: o1 모델은 웹 검색이 불가능하며, 2023년 10월까지의 훈련 데이터에만 의존합니다. 사용자들은 텍스트 입력을 통해 추가적인 맥락을 제공할 수 있습니다.
- 응답 시간: 출력 생성 속도가 느리며, 일부 응답은 1분 이상 소요되기도 하지만, 초기 테스트에서는 코딩 및 법적 문서 초안 작성과 같은 작업에서 성능이 향상되었다고 보고되었습니다.
OpenAI는 빠른 응답이 필요한 작업에는 GPT-4o가 이상적이며, 심층 추론이 필요한 애플리케이션에는 o1 모델이 더 적합할 수 있다고 조언합니다.
가격 구조
o1 모델에 접근하기 위해서는 OpenAI의 API에 상당한 투자를 해야 하며, 최소 $1,000를 지출하고 30일 전에 결제한 "Tier 5" 사용자인 경우에만 이용 가능합니다. o1-preview 모델은 입력 토큰 100만 개당 $15, 출력 토큰 100만 개당 $60의 높은 가격이 책정되어 있는 반면, o1-mini는 입력 토큰 100만 개당 $3, 출력 토큰 100만 개당 $12로 보다 저렴합니다. 현재 o1 모델은 분당 20개의 요청으로 제한되며, 배치 요청은 지원되지 않습니다.
o1 모델의 활용 사례
o1-preview와 o1-mini 출시 이후, 개발자들은 모델의 사용 가능성을 탐구하기 시작했습니다. 초기 발견으로는 다음과 같은 예가 있습니다:
- 문서 생성: 모델은 간단한 제안에 기반하여 잘 개발된 행동 계획과 백서를 생성할 수 있습니다.
- 운영 최적화: 사용자는 o1-preview를 통해 직원 일정 자동화, 인수 위험 평가, 효율적인 창고 설계 및 전력망 균형 조정 작업을 선보였습니다.
- 앱 및 게임 개발: o1-preview 모델은 인터랙티브 애플리케이션과 게임의 신속한 개발을 지원합니다.
- RFP 자동화: o1 모델은 계약자가 RFP의 텍스트 입력을 처리하여 요청 제안서 문서를 완성하는 데 도움을 줄 수 있습니다.
- 전략적 기획: 개발자들은 o1-preview가 Reddit과 같은 플랫폼을 활용하여 참여를 유도하는 상세한 성장 전략을 생성하는 데 효과적이라고 언급했습니다.
OpenAI의 o1 모델 접근하기
개발자는 OpenAI의 공개 API, Microsoft Azure OpenAI 서비스, Azure AI 스튜디오, GitHub 모델을 통해 o1 모델에 접근할 수 있습니다. 모든 개발자에게 적합하지는 않지만, o1 가족의 도입은 AI 애플리케이션 혁신을 원하는 이들에게 독특한 기회를 제공합니다. OpenAI는 o1 가족과 기존의 GPT 시리즈 모두를 향상시키기 위해 노력하고 있습니다.