메타의 창립자이자 CEO인 마크 저커버그는 개인 인스타그램에 체중을 이용한 다리 프레스를 하는 동영상을 공유하며 한 주를 기분 좋게 마무리했습니다. 2012년 메타가 인수한 이 소셜 네트워크는 혁신적인 발표에 완벽한 배경이 되었습니다.
무비 제너(Movies Gen) 소개
저커버그의 운동 루틴은 텍스트 프롬프트에서 비디오와 오디오를 생성할 수 있는 메타의 혁신적인 생성형 다중 모달 AI 모델, 무비 제너의 공개와 맞물려 있습니다. 사용자는 저커버그가 게시글에서 보여준 것처럼 간단한 텍스트 지시로 동영상을 특별 효과, 소품, 의상으로 개인화할 수 있습니다. 이 모델은 비디오 클립의 특정 요소를 수정할 수 있는 기능을 제공하며, 기존 AI 모델과 차별화됩니다. 최근 기술 문서에 따르면 무비 제너는 일관성과 동작 자연스러움과 같은 속성에서 런웨이 젠 3, 루마 드림 머신, 오픈AI 소라, 클링 1.5 등의 경쟁자를 능가합니다.
다양한 적용 가능성
메타는 무비 제너를 일반 사용자와 프로 콘텐츠 제작자, 심지어 할리우드 영화 제작자에게 필수 도구로 자리매김하고자 합니다.
무비 제너의 주요 기능
1. 무비 제너 비디오: 텍스트에서 비디오를 생성하는 300억 개의 파라미터를 가진 강력한 모델.
2. 무비 제너 오디오: 비디오에서 오디오를 생성하는 130억 개의 파라미터를 가진 모델.
3. 개인화된 무비 제너 비디오: 사용자가 제공한 이미지를 기반으로 커스터마이즈된 비디오 생성.
4. 무비 제너 편집: 정확한 비디오 편집을 위한 모델로, 지역 수정 및 배경 전환이 가능합니다.
사용자는 최대 16초의 고해상도(HD) 비디오를 생성할 수 있으며, 48kHz 오디오와 동기화됩니다.
고급 미디어 기능
무비 제너는 창작 과정을 간소화하는 기능을 제공합니다:
- 고품질 비디오 제작: 텍스트 프롬프트를 입력하는 것만으로 1080p 해상도의 HD 비디오를 생성할 수 있습니다. 이는 복잡한 카메라 동작과 객체 상호작용을 유지합니다.
- 개인화 콘텐츠 생성: 개인 이미지를 업로드하면 사용자가 AI가 생성한 비디오에서 자신의 정체성을 유지하면서 출연할 수 있습니다.
- 효율적인 비디오 편집: 사용자는 색상이나 객체를 변경하는 등의 특정 수정 사항을 간단한 텍스트 명령으로 적용할 수 있습니다.
- 동기화된 오디오 생성: 무비 제너 제품군은 비주얼과 일치하는 사운드 효과와 배경 음악을 제작할 수 있는 고급 오디오 모델을 포함합니다.
데이터 기반 혁신
무비 제너는 메타가 인터넷에서 수집한 방대한 데이터, 즉 1억 개의 비디오와 10억 개의 이미지를 활용해 훈련되었습니다. 그러나 메타는 데이터 출처의 법적 적합성에 대한 논란에 직면해 있으며, 이는 AI 개발과 관련된 저작권 및 사용자 권리에 대한 지속적인 논의와 유사합니다.
AI 훈련 방법 개선
메타의 접근 방식은 기존의 확산 모델 아키텍처에 '플로우 매칭'이라는 새로운 기술을 결합하여 훈련 효율성과 출력 품질을 향상시키고자 합니다. 주요 장점은 다음과 같습니다:
- 영 미분 신호 대 잡음 비율(SNR): 플로우 매칭은 추가 조정 없이 자연스럽게 SNR을 유지하여 비디오 출력의 일관성을 개선합니다.
- 훈련 및 추론 효율성: 이 방법은 다양한 모델 크기에 대해 성능 향상을 위한 더 큰 유연성을 제공합니다.
미래 전망
2025년 인스타그램에서 출시될 예정인 무비 제너는 다양한 사용자에게 고급 비디오 제작을 제공합니다. 메타는 기술을 계속 발전시키며 크리에이터 및 영화 제작자와의 협업이 중요하다고 생각하고 있습니다. 무비 제너가 제공하는 정교한 비디오 편집 도구로 인해 프로 아티스트의 작업을 보완하여 모든 사용자의 창의적인 선택권을 확대할 것으로 기대됩니다.
무비 제너의 도입은 메타 플랫폼에서 콘텐츠 제작 방식에 혁신을 가져올 것으로 보이며, 인스타그램 사용자는 최초로 이 혁신적인 기술을 활용하게 됩니다. 발전함에 따라 무비 제너는 전문가와 독립 제작자 모두에게 없어서는 안 될 도구가 될 수 있습니다.