지난 목요일, OpenAI는 새로운 텍스트-비디오 모델인 Sora의 데모를 공개했습니다. Sora는 사용자 프롬프트에 맞춰 인상적인 시각 품질을 유지하면서 최대 1분 길이의 비디오를 생성할 수 있습니다. 여러분은 OpenAI가 선보인 매력적인 비디오 클립을 보았을지 모릅니다. 예를 들어, 눈 속에서 나오는 골든 리트리버 강아지들부터 분주한 도쿄 거리에서 산책하는 커플들까지 다양한 장면이 펼쳐졌죠. 여러분의 반응은 경이로움과 흥분에서부터 회의감이나 우려까지 다양했을 것입니다. 이는 오늘날 생성형 AI를 둘러싼 다양한 감정을 반영합니다.
개인적으로 저는 놀라움과 호기심이 뒤섞였습니다. Sora의 출시가 의미하는 바는 무엇일까요? 제 생각에 Sora는 OpenAI의 상징적인 신비로움을 잘 보여줍니다. 이는 CEO 샘 올트먼의 짧은 경질과 복귀 이후 불과 3개월 만에 특히 두드러집니다. 이러한 신비로운 분위기는 모든 발표에 대한 기대감을 증대시킵니다.
OpenAI는 폐쇄적인 모델로 운영되며, 그 과정은 의도적으로 불투명하게 유지됩니다. 현재 수백만 명이 Sora를 둘러싼 모든 세부 사항을 분석하고 있으며, 모델의 작동 방식, 훈련 데이터, 출시 시기, 잠재적 응용 그리고 산업, 노동력, 사회, 환경에 대한 광범위한 함의에 대해 궁금해합니다. 이러한 추측은 상용화되지 않은 데모에서 비롯된 것으로, hype를 더욱 증폭시킵니다.
동시에 Sora는 인류 전체에 이익이 되는 인공지능 일반 지능(AGI) 개발을 향한 OpenAI의 사명에 대한 투명성을 반영합니다. OpenAI는 외부 피드백을 요청하고 향후 AI 기능을 엿볼 수 있도록 Sora의 연구 진행 상황을 조기에 공개하고 있다고 밝혔습니다. Sora 기술 보고서의 제목인 "세계를 시뮬레이션하는 비디오 생성 모델"은 OpenAI가 단순히 창작자를 위한 텍스트-비디오 도구를 출시하는 것이 아니라 AGI를 향한 AI 연구를 추진하고 있음을 나타냅니다.
이러한 매혹적인 역설—OpenAI의 현재 노력에 대한 신비와 장기 비전에 대한 명확성의 조화—는 대중의 인식과 사업 채택이 늘어남에 따라 종종 간과됩니다. Sora 팀의 연구자들은 현재 이 기술의 영향에 대해 명확히 인식하고 있으며, 창의적인 활동을 위한 배포에 대해 신중합니다. DALL-E를 공동 개발하고 Sora 팀의 일원인 OpenAI 과학자 아디티아 라메시는 매우 사실적인 비디오의 잠재적 오용에 대한 우려를 표명했습니다. 그는 “배포에 대해 신중하게 접근하고 있으며, 일반 대중에게 출시하기 전에 모든 기반을 다지고 있다”고 설명했습니다.
하지만 라메시는 Sora를 중요한 진전으로 보고 있습니다. “AI가 인간과 유사한 방식으로 세상을 이해하도록 발전하는 것에 대해 기대하고 있습니다”라고 X에서 언급했습니다. 라메시의 비디오에 대한 생각은 DALL-E 개발 회고 인터뷰로 거슬러 올라갑니다. 그는 비디오 기술의 함의에 대해 이미 고민하고 있었음을 밝혔습니다. DALL-E에 대한 관심을 묻자, 그는 시각과 관련된 지능의 독특한 측면을 강조했습니다. “비디오에서는 모델이 시간에 따라 인과관계를 이해하는 시퀀스를 생성할 수 있다고 상상할 수 있습니다”라고 그는 말했습니다.
대화 중, 라메시는 OpenAI의 이중성을 포착했습니다. 한편으로 그는 더 많은 사람들이 DALL-E의 능력을 경험할 기회를 누리게 하길 바랐고, 기술에 대한 더 넓은 접근을 원했습니다. 다른 한편으로는, 그의 주요 동기는 AI가 이룰 수 있는 경계를 넓히는 것이며, GPT-2와 같은 기술의 성공을 기반으로 하여 AI가 인간과 유사한 추론을 할 수 있는지 탐구하는 것이었습니다.
결국, Sora는 단순한 비디오가 아닙니다. 당장 창의적 도구로서 여러 도전 과제가 있을 수 있지만, OpenAI는 Sora를 보다 큰 비전의 일환으로 보고 있다는 점을 인식하는 것이 중요합니다. Sora를 “데이터 기반 물리 엔진”으로 다양한 세계를 시뮬레이트하는 것이라고 찬양하거나, “구조에 의한 분석”과 같은 구식 아이디어와 유사한 결함이 있는 시도로 비판하더라도, Sora를 뛰어난 비디오 애플리케이션으로만 국한시키는 것은 OpenAI의 이중적 목표를 간과하는 것입니다.
OpenAI는 소비자 제품, 기업 이니셔티브, 개발자 커뮤니티 참여를 통해 생성형 AI 전략을 실행하고 있습니다. 그러나 이 모든 것은 AGI 달성을 위한 디딤돌 역할을 하고 있습니다.
따라서 Sora의 목적에 대해 호기심이 많은 여러분께 이 이중성을 기억해 주시기 바랍니다. 현재 OpenAI는 비디오 분야에 종사하고 있지만, 궁극적으로는 훨씬 더 크고 위대한 목표를 지향하고 있습니다.