OpenAI의 강력한 GPT-4 대형 언어 모델(LLM)이 2023년 3월에 출시된 이후, 사용자와 개발자들은 그 후속 모델인 GPT-5의 출시에 큰 기대를 모았습니다. 그러나 OpenAI는 새로운 모델 계열인 o1 시리즈를 소개하며 다른 길을 선택했습니다.
o1 모델 계열 소개
OpenAI는 복잡한 과제를 더 효과적으로 해결하기 위해 설계된 최신 AI 모델인 o1-preview와 o1-mini를 공개했습니다. 현재 ChatGPT Plus 사용자에게 제공되는 o1-preview는 주당 30개의 메시지로 제한되며, o1-mini는 50개의 메시지를 허용합니다. 초기 모델인 만큼 기능은 계속 개발 중이며, GPT-4에서 제공되는 웹 검색 및 파일 업로드와 같은 기능은 지원하지 않습니다.
o1 모델의 우수한 기능
OpenAI는 o1 시리즈가 과학, 헬스케어, 기술 등 다양한 분야에서 복잡한 문제를 처리하는 데 뛰어나다고 주장합니다. 이 모델들은 물리학자들이 복잡한 방정식을 세우고 헬스케어 연구자들이 세포 서열 데이터 주석을 효과적으로 작성하는 데 도움을 주기 위해 개발되었습니다.
o1-mini 모델은 개발자들에게 특히 강력한 기능을 제공하여, 다단계 워크플로우 실행, 코드 디버깅 및 프로그래밍 문제 해결에 적합합니다.
o1-preview: 박사 수준의 성능
o1-preview 모델은 심사숙고한 반응을 위해 더 많은 시간을 할애하여, 인간의 문제 해결 접근 방식을 모방합니다. 테스트 결과, 물리학, 화학, 생물학 분야에서 박사 과정 학생에 필적하는 성과를 보였습니다. 코딩 분야에서는 Codeforces 대회에서 89번째 백분위수에 위치하며, 디버깅 및 솔루션 생성에서 높은 능력을 입증했습니다. 국제 수학 올림피아드 예선에서는 83%의 문제를 해결하여, GPT-4의 13% 성공률에 비해 크게 향상된 결과를 보여주었습니다. 이 모델은 현재 ChatGPT Plus와 Team 사용자에게 제공되며, 다음 주에는 Enterprise 및 Edu 사용자가 접근할 수 있습니다. API 티어 5에 해당하는 개발자는 o1 모델을 사용할 수 있으나 초기 사용 제한이 적용됩니다.
o1-mini: 경제적이고 효율적인 모델
OpenAI는 o1-preview와 함께 더 빠르고 경제적인 추론 기능을 제공하는 o1-mini 모델을 출시했습니다. o1-mini는 코딩 및 STEM 분야에 특화되어 있으며, IMO 수학 기준에서 70%를 기록해 o1-preview의 74%와 근접한 성과를 보였습니다. 코딩 평가에서는 Codeforces에서 1650의 Elo 점수를 기록하여 상위 86%의 프로그래머에 포함되었습니다.
o1-preview에 비해 80% 낮은 가격으로 제공되는 o1-mini는 고급 모델의 폭넓은 지식 없이도 추론 능력을 원하는 개발자와 연구자에게 적합합니다. ChatGPT Plus, Team, Enterprise, Edu 사용자에게 제공되며, 향후 ChatGPT Free 사용자도 포함할 계획입니다.
안전성 및 보안 개선
OpenAI는 두 모델 모두에서 안전성에 대한 헌신을 보입니다. o1-preview 모델은 가장 어려운 탈옥 평가 중 하나에서 84점을 기록하며, GPT-4의 22점보다 크게 개선된 성과를 나타냈습니다. 이 모델들은 안전 프로토콜에 대한 맥락적 추론 능력이 향상되어, 위험한 프롬프트를 처리하고 부적절한 콘텐츠 생성을 줄이는 데 더 잘 대비하도록 설계되었습니다.
OpenAI는 또한 미국 및 영국 AI 안전 연구소와 협력하여 미래 AI 시스템의 평가 및 테스트를 진행하고 있습니다.
o1 시리즈의 미래 개발
o1-preview와 o1-mini는 강력한 문제 해결 도구지만, OpenAI는 이러한 변화가 시작에 불과하다고 인식하고 있습니다. 회사는 향후 업데이트를 통해 웹 검색, 파일 업로드 및 기능 호출과 같은 기능을 정기적으로 추가할 계획입니다.
OpenAI가 GPT 및 o1 시리즈를 지속적으로 개발함에 따라, 사용자들은 다양한 응용 분야에서 AI의 능력과 접근성을 향상시키는 지속적인 발전을 기대할 수 있습니다.