OpenAI는 최근 GPT 언어 모델에 대한 우려를 적극적으로 해결하고 있는 것으로 보입니다. 특히, GPT-4가 "게으르다," "어리석다,"는 비판이 제기되었으며, 이러한 문제는 11월 하순 소셜 미디어에서 주목받았습니다. 이에 따라 일부 사용자가 기반으로 제기한 추측에 따르면, GPT-4.5가 조용히 일부 사용자에게 도입되었을 가능성이 있다는 이야기도 있습니다. 이론의 진위 여부를 떠나 최근 몇 주간 GPT-4에 대한 내부 개선이 있었던 것으로 보입니다.
지난 목요일부터 사용자들은 GPT-4의 성능 향상을 보고하기 시작했습니다. Wharton 교수인 Ethan Mollick은 11월에 GPT-4의 능력이 저하되었다고 언급했던 바 있으며, 이번에는 모델의 효율성과 응답 품질이 크게 향상되었다고 평가했습니다. 다만, GPT-4.5로의 전환에 대한 증거는 없었습니다. 그는 코드 해석기를 사용한 후, 개선된 성능을 "밤과 낮의 차이"라고 묘사하며 이전의 GPT-4가 수주간 "신뢰할 수 없고 약간 지루했다"고 언급했습니다.
이 시기에 OpenAI는 지난 수요일에 ChatGPT Plus 구독을 재개했으며, 이는 11월 14일 이후 등록이 중단된 상태였습니다. Altman은 X에 올린 게시물에서 추가 GPU를 확보하는 동안 사용자들에게 인내해줄 것을 감사했습니다. ChatGPT Plus 구독 재개와 GPT-4의 향상 간의 직접적인 연관성이 있는지는 불확실하지만, 타이밍은 주목할 만합니다. 구독이 중단된 이후 OpenAI의 첫 DevDay가 있었고, 이 자리에서는 AI 챗봇의 프리미엄 버전에 대한 여러 새로운 기능이 소개되었습니다. 그 결과, ChatGPT Plus 구독에 대한 대기 리스트가 생겼고, DevDay 후의 가입이 처리 용량을 초과했습니다.
사용자들은 GPT-4가 명령을 실행하기보다 설명을 제공하는 문제를 제기한 바 있습니다. 이러한 불만 이후, GPT-4의 비정상적인 행동에 대한 보고가 이어졌으며, 이는 사용자들이 익숙한 AI의 특성과는 거리가 있었습니다. 자주 발생한 문제 중 하나는 GPT-4가 사용자의 요구에 대해 여러 번의 명확성을 요구하거나 "맞짱"을 치는 경우였습니다. 또 다른 문제는 명령을 완료하기보다 설명을 하는 경향이었습니다.
GPT-4의 성능 저하는 최소한 7월부터 시작된 것으로 보이며, 한 연구에서는 3월과 6월 사이의 정확도가 크게 감소했음을 보여주었습니다. OpenAI 제품 부사장인 Peter Welinder는 답변 품질에서의 인식된 결함이 모델의 업데이트 과정에서 나타나는 심리적 효과일 수 있다고 언급했습니다. 일부 사용자는 쿼리를 변경하면 더 나은 결과를 얻을 수 있다고 제안했습니다.
OpenAI는 최근 내부 개발 사항에 대해 비교적 조용했지만, Altman의 GPU 관련 게시물은 이러한 변화의 중요한 지표로 보입니다. 4월의 보고서에 따르면, OpenAI는 2023년 나머지 기간 동안 상업적 성과를 유지하기 위해 30,000개 이상의 GPU가 필요하다고 합니다. 이는 11월에 목격된 관심 급증 이전의 상황입니다.
GPT-4.5에 대한 추측이 고조되고 있으며, 새로운 버전에 대한 세부 정보가 유출되면서 더욱 가속화되었습니다. @therundownai 뉴스레터 창립자인 Rowan Cheung은 X에 이 발전과 관련된 가격 정보 및 고급 멀티모달 기능을 공유했습니다. Cheung이 이러한 세부 사항의 진위를 물었을 때 Altman은 간단히 "아니다"라고 답했습니다.
GPT-4.5에 대한 추측은 새로운 모델의 기능과 가격을 보여주는 사진과 함께 시작되었습니다. 그러나 Altman은 이 루머를 근거 없다고 일축했습니다. 그럼에도 불구하고, 업데이트를 경험한 사용자는 성능이 뛰어난 GPT-4.5를 경험하고 있다고 주장하며, "GPT-4.5 Turbo"와 같은 응답을 받았다고 밝혔습니다. 이는 많은 사람들이 OpenAI가 주로 모바일 애플리케이션을 통해 GPT-4.5를 베타 테스트하고 있다고 추론하는 계기가 되었습니다. 그러나 모든 사용자가 이러한 발견을 재현할 수 있는 것은 아니며, 종종 자신들이 표준 GPT-4를 사용하고 있다고 들었습니다. OpenAI 직원인 Will Depue는 이러한 변화를 "매우 이상하고 일관된 환각"이라고 언급했습니다.
Cheung은 공식 ChatGPT X 페이지의 게시물에서 두뇌와 구름을 묘사한 이모지를 발견했으며, 이를 OpenAI가 환각 현상을 미묘하게 인정한 것으로 해석했습니다. OpenAI는 ChatGPT Plus, 개발자 API 사용자, 기업 고객 등을 포함하여 유료 사용자에게 조기 액세스를 제공합니다. 이러한 사용자들은 새로운 GPT 버전과 기능을 시험해볼 기회가 많은 만큼, 모델 성능을 실험하는 이들은 개발자 API 접근 권한을 가지고 있을 가능성이 높습니다.
OpenAI가 현재 GPT-4.5를 테스트하고 있다면, 공식 업데이트 일정은 여전히 불확실하며, 최근 조직적 도전에서 안정화를 위한 과정이 필요해 보입니다. 제품이 계속 진화하면서, 사용 중인 ChatGPT의 "버전"보다 실질적인 개선 사항이 더욱 중요해지는 것은 분명합니다.