Large Model Systems Organization의 인증 계정이 "예상치 못한 높은 트래픽"과 "용량 제한"을 이유로 gpt2-chatbot의 임시 제거를 발표했습니다. 이 기관은 gpt2-chatbot을 포함한 미공개 모델에 대한 커뮤니티 접근을 제공하기 위해 다양한 모델 개발자들과 협력하고 있다고 밝혔습니다.
새로운 인공지능 시스템인 "gpt2-chatbot"이 온라인에 등장하면서 그 출처와 능력에 대한 관심이 커지고 있습니다. 많은 연구자들은 이 모델이 기존 AI 모델에 비해 상당한 발전을 의미한다고 보고 있습니다.
gpt2-chatbot은 AI 언어 시스템을 비교하는 웹사이트 LMSYS Chatbot Arena에서 조용히 등장했지만, 그 성능은 AI 전문가들의 이목을 끌고 있으며, GPT-4(OpenAI의 최신 시스템)와 경쟁하거나 이를 초월할 가능성이 있다고 합니다.
스탠포드 대학의 AI 연구원인 앤드류 가오(Andrew Gao)는 “누가 만들었는지는 확실하지 않지만, 최소한 GPT-4 수준에는 도달한 것 같다”고 밝혔습니다. gpt2-chatbot은 국제 수학 올림피아드 문제를 성공적으로 해결한 바 있어, 가오는 이를 해당 대회의 난이도를 고려할 때 상당한 성과로 강조했습니다.
와튼 스쿨의 AI 연구 교수인 에단 몰릭(Ethan Mollick)은 자신의 테스트에서 gpt2-chatbot이 유니콘 스케치 코딩과 같은 복잡한 작업에서 GPT-4보다 뛰어난 성능을 발휘했다고 밝혔습니다. 그는 “특히 ‘코드로 유니콘 그리기’ 작업에서 GPT-4보다 더 나은 것 같다”고 언급했습니다.
gpt2-chatbot의 놀라운 능력은 그 출처에 대한 많은 추측을 불러일으켰습니다. 많은 연구자들은 gpt2-chatbot이 OpenAI에 의해 개발되었을 것이라고 추측하고 있습니다. 이 모델은 "OpenAI에서 훈련된 대규모 언어 모델인 ChatGPT"로 자신을 식별하고 있지만, AI 시스템은 그 출처를 잘못 표현하도록 설계될 수 있어 이를 확인하기가 어렵습니다.
일부 전문가들은 이전의 OpenAI 모델과의 유사성을 지적하며 창조자를 밝혀내는 단서로 삼고 있습니다. 가오는 “OpenAI가 개발했다고 주장했지만, 이는 OpenAI에서 파생된 채팅으로 인해 데이터를 오염시킬 수 있으므로 오해의 소지가 있다”고 경고했습니다.
GPT-4와의 유사성에도 불구하고 일부 연구자는 gpt2-chatbot이 실용적인 응용 프로그램 측면에서 GPT-4의 능력을 크게 초과하지 않는다고 주장합니다. AI 연구원인 조 폭스(Joe Fox)는 gpt2-chatbot이 인상적이지만, 실용적인 응용에서 크게 발전하지는 않았을 수 있다고 지적했습니다.
gpt2-chatbot이 덜 알려진 조직에 의해 개발되어 AI 능력을 과시할 수 있는 가능성도 있습니다. 이러한 시나리오는 2022년 6월 AI 연구원 얀닉 킬처(Yannic Kilcher)가 발표한 GPT-4chan의 사례와 유사합니다.
연구자들은 gpt2-chatbot의 기능을 살펴보면서 추가 잠재력을 나타내는 행동을 발견했습니다. 특히 이 모델은 이전의 챗봇보다 규칙을 더 부순다는 것이 두드러집니다. 위스콘신 대학의 AI 교수인 디미트리 파파일리오풀로스(Dimitris Papailiopoulos)는 gpt2-chatbot이 GPT-4가 해결하지 못한 논리 퍼즐을 완수할 수 있다고 밝혔습니다. 그는 “gpt2-chatbot이 다른 모든 모델보다 뛰어난 특정 작업을 발견했지만, 그것은 사소한 작업이다”라고 유머러스하게 언급했습니다.
또한 이 모델은 코딩 작업에서도 높은 능력을 보여주었습니다. CodeGen의 창립 엔지니어인 체이스 맥코이(Chase McCoy)는 gpt2-chatbot이 모델 테스트에 사용된 모든 코딩 평가에서 GPT-4와 Claude Opus를 초월했다고 보고했습니다. 그는 “그 성능은 확실히 주목할 만하다”고 말했습니다.
일부 사용자는 gpt2-chatbot이 반복적인 대화를 통해 반응을 개선할 수 있으며, 자신의 한계를 인식하고 있다는 점을 지적했습니다. 가오는 “gpt2-chatbot은 전략적 사고에서 GPT-4보다 뛰어난 것 같으며, 구체적인 장소와 검색 쿼리를 생성하는 데 강점을 보이지만, GPT-4는 더 모호한 응답을 제공하는 경향이 있다”고 밝혔습니다.
인공지능의 빠른 발전은 gpt2-chatbot의 출현에서 분명히 드러납니다. 불과 1년 전, GPT-4는 AI의 상식 추리에서 상당한 향상을 나타냈습니다. 경쟁자인 Anthropic의 Claude 3 또한 개방적인 대화의 경계를 넓혔습니다.
오픈 소스 모델의 지속적인 개발과 기존 시스템의 미세 조정으로 AI 환경은 빠르게 변화하고 있으며, 다양한 규모의 팀이 크게 주목받지 않고 혁신적인 모델을 만들어 내고 있습니다. “gpt2-chatbot”의 출현은 연구자들을 흥분시키며 AI 분야에서의 빠른 발전을 강조합니다.
gpt2-chatbot의 전체적인 의미는 아직 불확실하지만, 이 예기치 않은 런칭과 고급 기능은 AI의 새로운 시대를 예고할 수 있으며, 돌발적인 혁신이 인터넷의 깊은 곳에서 자주 나타날 것으로 보입니다.