스테이빌리티 AI(Stability AI)는 유명한 텍스트-이미지 시스템인 스테이블 디퓨전(Stable Diffusion)의 개발사로, 새로운 비디오 생성 모델인 스테이블 비디오 디퓨전(Stable Video Diffusion)을 출시했습니다. 이 최첨단 생성 AI 모델은 텍스트 프롬프트를 동적인 비디오로 변환할 수 있습니다. 사용자는 "사막에서 로켓이 이륙하는 장면"이나 "해안에 부딪히는 파도"와 같은 문구를 입력하면, 스테이블 비디오 디퓨전이 이 설명을 생생하게 구현합니다.
이 모델은 텍스트 프롬프트뿐만 아니라 정지 이미지로부터도 비디오를 생성할 수 있습니다. 스테이블 비디오 디퓨전의 연구팀은 고해상도 이미지-비디오 합성을 위해 특별히 설계했습니다. 주요 기능 중 하나는 다중 시점 합성으로, 애니메이터가 단일 객체로부터 여러 카메라 각도를 생성할 수 있게 해줍니다. 이 기능은 가상 현실(VR) 및 증강 현실(AR) 애플리케이션을 위한 몰입형 3D 환경을 구축하는 개발자에게 큰 도움이 될 수 있습니다.
스테이블 비디오 디퓨전 접근 방법
현재 스테이블 비디오 디퓨전은 연구 목적으로만 제공되고 있습니다. 개발자들은 이 모델이 "현실세계나 상업적 응용을 위한 것이 아니다"라고 밝혔습니다. 대신, 그들은 모델을 향후 사용을 위해 개선하기 위해 안전성과 성능에 대한 피드백을 수집하는 데 집중하고 있습니다.
스테이블 비디오 디퓨전을 탐색하고자 하는 연구자들은 GitHub에서 소스 코드를 찾을 수 있으며, 로컬 모델 실행에 필요한 가중치는 Hugging Face에 호스팅되어 있습니다. 이 모델은 14프레임과 25프레임을 생성할 수 있는 두 가지 이미지-비디오 옵션을 제공하며, 3프레임에서 30프레임까지 조정 가능한 프레임 속도를 지원합니다.
사용자 선호도를 비교하는 초기 연구에 따르면, 스테이블 비디오 디퓨전은 Pika Labs와 Runway의 경쟁 모델에 비해 긍정적인 평가를 받고 있어, 비디오 생성 분야에서의 잠재력을 입증하고 있습니다.
흥미롭게도, 사용자는 교육, 마케팅, 엔터테인먼트 등 여러 분야에서 스테이블 비디오 디퓨전의 실제 응용 프로그램을 보여주는 웹 인터페이스에 접근하기 위한 대기자 명단에 등록할 수 있습니다. 이 혁신적인 경험에 관심이 있는 사용자는 문의 양식에서 '스테이블 비디오 - 대기자 명단'을 선택하면 됩니다.
스테이빌리티 AI는 생성 기술의 경계를 넓히며 비디오 생성과 창의적 콘텐츠 제작에 새로운 가능성을 열어가고 있습니다. 모델이 발전함에 따라, 풍부한 비주얼 스토리텔링을 활용하는 다양한 분야에서 많은 응용 가능성이 기대됩니다.