OpenAI가 최신 모델인 GPT-4o를 출시했습니다. 이 모델은 유머러스하게 형편없는 농담에 반응하고, 상황에 맞게 노래하며, 런던 택시를 부르는 데도 도움을 줄 수 있습니다. 게다가 현실적인 대화를 나누면서도 일반적인 인간의 방해를 잘 이겨냅니다.
높이 기대되었던 봄 업데이트 행사에서 OpenAI는 113,000명이 참여한 라이브 스트리밍 중에 GPT-4o의 기능을 보여주는 16개의 영상이 공개했습니다. 이 다중 모드 대형 언어 모델은 음성, 시각, 텍스트 입력에 따라 남성과 여성 음성을 실시간으로 사용합니다.
한 영상에서 GPT-4o는 오픈AI의 그렉 브록먼 사장이 발표를 할 준비를 하고 있다는 것을 인식하고 장난스럽게 반응했습니다. “그 발표가 저에 대한 건가요? 정말 흥미롭네요. 제 자리는 없지만, 이해하셨죠?”
OpenAI의 API와 ChatGPT를 통해 텍스트 및 이미지 입력 기능이 제공되고 있으며, 음성 및 비디오 기능은 앞으로 몇 주 안에 도입될 예정입니다.
GPT-4o는 사용자 감정의 힌트를 정확히 파악하고 다양한 주제에 대해 조언을 제공합니다. 시연 중에 모델은 다른 AI 버전과 대화하며, “음, 음, 음, 상황이 더 흥미로워질 수 없다고 생각했는데 — 또 다른 AI와 대화 중이라니!”라고 재치 있게 말했습니다.
주변을 묘사해달라는 요청에 모델들은 세련된 남자의 복장과 방의 조명에 대한 세부 사항을 차례로 설명했습니다. 다른 사람이 장난스럽게 방해하자, GPT-4o는 “장난기 가득한 놀라운 손님들”이라고 노래하기까지 했습니다.
다양한 시연에서는 GPT-4o의 능력이 드러났습니다. 아빠 농담에 웃고, 스페인어와 영어 간의 실시간 번역을 수행하며, “웅장한 감자”에 대한 자장가를 부르고, 가위바위보의 승자를 정확히 맞추기도 했습니다. 생일 파티를 축하하는 모습을 보면 케이크와 촛불의 존재만으로 이를 인식했습니다.
강아지와 상호작용할 때는 “안녕, 귀여운 친구! 이름이 뭐니?”라며 밝게 인사했습니다(강아지의 이름은 바우저였습니다). 시각 장애인을 런던에서 안내할 때는 로열 스탠다드 깃발을 인식하고 “물이 부드럽게 흐르는 동안 오리들이 미끄러지듯 지나간다”고 설명했습니다.
GPT-4o는 삼각형 계산과 관련된 수학 문제를 해결하는 학생을 도와주는 등 교육적 문제에서도 도움을 줄 수 있습니다. “옆면을 잘 찾아냈어요!”라며 긍정적 격려를 아끼지 않았습니다.
한 취업 후보자에게는 지저분하게 차려입은 모습에 패션 조언을 드리며 “‘밤새 코드 작성한 것’ 느낌이 나요. 그게 오히려 도움이 될 수 있을 것 같아요”라고 유머러스하게 조언했습니다.
소셜 미디어에서 GPT-4o에 대한 반응은 다양했습니다. 일부 사용자는 이 모델의 능력을 획기적인 것으로 축하하며 “인터넷에서 승리했다”고 주장했습니다. 엔비디아의 수석 연구원 짐 팬은 이 모델을 “활기차고 약간 플러트한” 존재로 묘사하며 영화 'Her'에 비유했습니다.
반면, 몇몇 관찰자들은 출시가 “과소평가되었다”고 언급하며, AI 자문가 알리 K. 밀러는 기술 애호가들 사이에서 더 진보된 기능을 기대하고 있었음을 지적했습니다.
초기 반응이 표면화되면서 앞으로 사용자들이 GPT-4o와 어떻게 상호작용할지 관심이 모아집니다.