최근 구글의 첨단 AI 모델인 Gemini 1.5가 OpenAI의 새 비디오 생성 도구인 Sora에 대한 심층 평가를 진행했습니다. Sora는 시각적으로 매력적인 동영상을 제작하지만, Gemini 1.5는 여러 비논리적인 세부 사항들을 강조했습니다.
예를 들어, Sora가 생성한 일본 거리 풍경을 담은 영상에서는 폭설과 함께 만개한 벚꽃이라는 초현실적인 조화가 보여집니다. 실제로 벚꽃은 따뜻한 봄날씨에 피어나기 때문에 이 조합은 불가능합니다. 더군다나, 폭설의 모습은 너무 고르며 실제 폭설의 패턴과는 크게 다릅니다. 영상 속 캐릭터들이 겨울 날씨에도 불구하고 여름 옷을 입고 있다는 사실은 이 비디오의 비현실성을 더욱 부각시킵니다.
Gemini 1.5의 분석가들은 “Sora의 비디오는 시각적으로 매력적이지만, 뚜렷한 불일치가 이러한 장면들이 현실에서 유래하지 않았음을 보여준다”고 언급했습니다. 이 평가는 AI 생성 기술이 진정성과 논리적 일관성 측면에서 직면하고 있는 현재의 도전 과제를 드러냅니다.
또한, Gemini 1.5 모델은 백만 개의 토큰 컨텍스트 윈도우를 통해 뛰어난 처리 능력을 보여주며, 경쟁자들을 훨씬 능가합니다. 이 기능 덕분에 한 번에 방대한 양의 정보를 처리할 수 있으며, 1시간 분량의 비디오와 30,000줄 이상의 코드를 포함할 수 있습니다.
AI 기술이 계속 발전함에 따라, 앞으로 더욱 사실적이고 생동감 넘치는 비디오 생성이 기대됩니다.