소라 비디오 생성 모델 출시: 유망한 기술, 그러나 중대한 도전 과제가 남아 있습니다.

최근 OpenAI는 혁신적인 비디오 생성 모델인 Sora를 공개하며 텍스트-비디오 기술에서 큰 발전을 이루었습니다. 그러나 블룸버그의 테스트에서 Sora의 몇 가지 주요 제한 사항이 드러났습니다. 예를 들어, 원숭이 옆을 지나가는 앵무새의 장면에서 앵무새의 날개가 찌그러지고 원숭이가 앵무새의 꼬리를 이상하게 가지는 모습이 관찰되었습니다. 이러한 현상들은 Sora가 물체의 물리적 특성을 이해하는 데 어려움을 겪고 있음을 강조합니다. OpenAI의 과학자 빌 피블스는 "클립 내에 분명히 이상한 움직임이 있다"고 인정했습니다.

Sora는 확산 변환기 기술을 사용하여 비디오 콘텐츠를 작은 세그먼트로 분해하고, 노이즈 제거 기법을 통해 원래의 선명한 이미지를 예측합니다. 이러한 접근 방식은 비디오 생성 품질을 향상시키지만, Sora는 물체 간 상호 작용의 정확성, 상태 변화의 일관성, 긴 샘플의 일관성, 자발적인 물체 출현, 손과 신체 부위 처리, 계산 자원 요구, 모델 일반화 능력, 비디오 편집 및 확장 가능성 등 여러 도전 과제에 직면해 있습니다. 복잡한 장면에서는 Sora가 농구공이 훅 옆으로 지나가는 불리한 동작이나 개들이 서로 지나갈 때의 비현실적인 행동을 생성할 수 있습니다.

특정 상황에서 Sora의 뛰어난 성능에도 불구하고 OpenAI는 모델이 다양한 기술적 과제를 극복해야 함을 인식하고 있습니다. 기술의 발전에 따라 Sora의 더 밝은 미래에 대한 기대를 가질 수 있습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles