OpenAI는 ChatGPT나 LLM 회사로만 인식되는 범위를 넘어 새로운 가능성을 열고 있습니다. 오늘 이 조직은 혁신적인 AI 텍스트-비디오 생성 모델인 Sora를 공개했습니다. 공동 창립자이자 CEO인 샘 올트먼은 이 출시를 "remarkable moment(주목할 만한 순간)"이라고 표현했습니다.
현재 Sora는 일반 대중에게 제공되지 않습니다. 올트먼은 이 모델이 "시작적 레드팀 테스트" 중에 있다고 설명하며, 이는 보안 취약점을 식별하기 위한 단계입니다. 그러나 "제한된 수의 제작자"가 모델에 접근할 수 있으며, 더 넓은 대중에게는 향후 공개될 예정입니다.
경쟁적인 시장 진입
Sora는 Runway, Pika, 그리고 Stability AI와 같은 스타트업과 Google의 Lumiere 모델 같은 기존 플레이어가 이미 제공하는 AI 비디오 생성 솔루션과 경쟁하는 필드에 등장합니다. Sora의 차별점은 뛰어난 품질에 있습니다. OpenAI가 발표한 샘플 비디오는 놀라운 선명도, 유동적인 움직임, 인간 해부학 및 물리적 환경을 정확히 표현하는 능력을 보여줍니다. 특히 Sora는 한 번에 60초 비디오를 생성할 수 있어, 한 번에 4초만 출력하는 Runway와 Pika를 능가합니다.
사용자 참여를 통한 실시간 시연
올트먼과 Sora팀은 연구원 윌 데퓨와 함께 Twitter/X에서 사용자로부터 프롬프트를 수집하는 흥미로운 이니셔티브를 진행하고 있습니다. 이 입력을 활용해 Sora의 능력을 실시간으로 보여주며, 모델의 잠재력을 집단적으로 시연하고 있습니다.
일상적인 순간의 사실감
Sora는 매혹적인 비주얼을 넘어 일상적인 장면을 놀라운 사실감으로 구현합니다. 고가의 기차에서 본 도시 풍경이나, 고양이와 함께하는 여성의 친밀한 순간과 같은 비디오는 Sora가 인간의 공감 가능한 경험을 얼마나 잘 포착하는지를 강조합니다.
또한 OpenAI의 연구원 빌 피블스는 "인공지능 일반화" (AGI), 즉 경제적으로 가치 있는 작업에서 인간의 성능을 초월하는 AI를 달성하는 데 Sora가 큰 도움을 줄 것이라고 언급했습니다. Sora는 포괄적인 시뮬레이션을 가능하게 하여 이 목표에 기여할 것입니다.
AI의 전환점
미국 연방 정부가 사기 및 딥페이크에 대한 우려로 AI 규제 노력을 강화하는 가운데, Sora의 출시는 OpenAI뿐만 아니라 전체 기술 및 미디어 분야에 중요한 이정표를 세우고 있습니다. Sora가 사회에 미칠 긍정적이든 부정적이든 그 영향은 앞으로 어떻게 전개될지 지켜봐야 할 것입니다.