수개월간의 개발에 대한 추측에도 불구하고, OpenAI가 지난 주에 공개한 Project Strawberry는 많은 분석가들에게 놀라움을 안겼습니다. 그들은 이 모델이 몇 주, 아니면 늦어도 이번 가을까지는 준비되지 않을 것이라고 예상했기 때문입니다.
새로운 o1-preview 모델과 o1-mini 변형 모델은 이제 사용 및 평가가 가능해졌습니다. 접근 방법은 다음과 같습니다.
OpenAI는 응답 생산 전 사고 능력을 향상시키기 위해 설계된 혁신적인 AI 모델 시리즈 o1의 프리뷰를 소개했습니다. 이 모델은 과학, 코딩, 수학 등 복잡한 작업과 고난도의 문제를 해결하는 데 탁월합니다.
o1이란?
OpenAI의 인공지능 일반화(AGI)에 대한 포부는 잘 알려져 있으며, Project Strawberry(현재 "o1"로 브랜드 변경)는 그 비전을 향한 중요한 진전을 의미합니다. 이 모델은 사고를 더 많이 할애하고 응답하기 전에 더 깊이 생각하도록 설계되었으며, 이는 공식 발표에 따른 것입니다. 이러한 접근 방식은 이 모델이 복잡한 작업을 효과적으로 처리하고, 이전 버전보다 어려운 문제를 해결할 수 있도록 합니다. 모델은 인간과 유사한 사고 과정을 모방하도록 설계되어, 다양한 전략을 실험하고 훈련 과정에서 실수로부터 배울 수 있습니다. OpenAI는 o1-preview가 물리학, 화학, 생물학과 같은 과목에서 박사 과정 학생들과 비교할 수 있는 성과를 올리고 있으며, 해당 분야의 기준 평가에서도 긍정적인 결과를 나타냈다고 주장합니다. 과학 분야에서의 능력 외에도, o1은 코딩과 수학적 도전에서도 뛰어난 성과를 보이며, International Mathematics Olympiad(IMO) 자격 시험에서 83%를 기록한 반면, GPT-4o는 겨우 13%에 그쳤고, 인간 참가자들과의 Codeforces 경쟁에서 89번째 백분위에 도달했습니다.
o1-mini는 무엇인가요?
o1-mini는 표준 o1-preview 모델의 간소화된 버전으로, 비용이 80% 낮게 운영된다고 알려져 있습니다. 이는 코딩 분석 및 생성 과제에서 특히 효과적입니다.
o1-preview는 테스트 가능한가요?
네, o1-preview 모델은 9월 12일에 출시되어 ChatGPT Plus와 Teams 구독자에게 독점적으로 제공됩니다. 기업 및 교육 사용자들은 다음 주부터 접근할 수 있습니다.
o1의 안전성은 어느 정도인가요?
보도에 따르면, o1은 강화된 안전 조치와 함께 개발되었습니다. OpenAI는 모델의 고급 사고 능력을 활용해 안전 및 정렬 프로토콜 준수를 더 철저히 하는 새로운 안전 교육 프로그램을 수립했습니다. 특히 테스트에서, GPT-4o가 탈옥 시도에 저항하는데 100점 중 22점에 그쳤다면, 새로운 o1 모델은 인상적인 84점을 기록했습니다.
o1-preview에 어떻게 접근할 수 있나요?
현재 새로 출시된 o1-preview는 유료 구독자에게만 제공됩니다. 사용하기 위해서는 월 $20의 Plus 구독이 필요합니다. 왼쪽 내비게이션 메뉴에서 Upgrade Plan 라디오 버튼을 클릭하고 화면 지침에 따라 결제 정보를 입력하세요. 구독이 활성화되면 ChatGPT 홈페이지 왼쪽에서 모델 선택 토글을 통해 o1-preview 또는 o1-mini를 선택할 수 있습니다. 다만, o1-preview는 주당 30회, o1-mini는 50회로 접근이 제한되어 있음을 유의해 주세요. OpenAI는 o1-mini가 결국 무료 사용자에게도 제공될 것이라고 밝혔지만, 구체적인 출시 날짜는 아직 정해지지 않았습니다.