스테이블 비디오 디퓨전을 이제 Stability AI API를 통해 사용하여 비디오 제작을 향상시킬 수 있습니다.

Stability AI는 유명한 Stable Diffusion 텍스트-이미지 생성기를 개발한 기업으로, 최신 기초 모델인 Stable Video Diffusion (SVD)를 출시했습니다. 이 모델은 회사의 개발자 플랫폼과 API를 통해 접근 가능하며, 타사 개발자들이 자신의 앱, 웹사이트 및 소프트웨어 솔루션에 통합할 수 있도록 합니다.

회사는 블로그 게시물에서 "이 새로운 추가 모델은 다양한 산업에 맞춘 최첨단 비디오 모델에 대한 프로그래밍 접근을 제공합니다. 우리의 목표는 개발자들이 선진 비디오 생성을 제품에 원활하게 통합할 수 있는 효율적인 방법을 제공하는 것입니다."라고 밝혔습니다.

이 출시로 기업들은 AI로 생성된 비디오 제작을 위한 강력한 도구를 갖추게 되었지만, 몇 가지 우려도 제기되고 있습니다. Stability AI는 최근 부적절한 콘텐츠가 포함된 LAION-5B 데이터셋을 사용한 사실로 주목을 받았으며, 이는 이후 회수되었습니다.

그럼에도 불구하고 Stability의 SVD API는 비디오 품질에서 경쟁 우위를 제공합니다. 회사의 LinkedIn 게시물에 따르면, SVD 모델은 25개의 생성된 프레임과 24개의 FILM 보간 프레임을 포함하여 2초 분량의 비디오를 단 41초 만에 생성할 수 있습니다. 이는 대규모 비디오 캠페인에는 부족할 수 있지만 GIF 및 특정 메시지, 특히 밈 생성에는 유용합니다.

SVD는 최근 5,500만 달러의 자금을 확보하고 새로운 비디오 편집 플랫폼을 출시한 Runway 및 Pika Labs의 다른 비디오 생성 모델과 경쟁하고 있습니다. 그러나 Stability AI와 달리 이들 모델은 API를 통해 접근할 수 없어 사용자가 웹사이트나 앱을 직접 방문해야 합니다.

또한 Stability AI는 비디오 생성기를 위한 사용자 인터페이스 웹 경험을 출시할 계획이며, 사용자가 조기 액세스를 위한 대기자 명단에 등록하도록 독려하고 있습니다.

Stable Video Diffusion 이해하기

Stable Video Diffusion은 한 달 전 연구 미리보기로 소개되었고, 사용자는 JPG 및 PNG와 같은 정지 이미지로 MP4 비디오를 생성할 수 있습니다. 초기 샘플에 따르면, 이 모델은 최대 2초 길이의 짧은 클립을 생성할 수 있지만, 일부 연구 중심 모델보다 지속 시간이 짧고 아직 개발 단계에 있습니다.

하지만 여러 짧은 클립을 결합해 더 긴 비디오를 만들 수 있습니다. Stability AI는 이 모델이 광고, 마케팅, TV 및 영화, 게임 등 다양한 산업에서 유용할 것이라고 주장합니다.

중요하게도, 최신 모델은 1024×576, 768×768, 576×1024와 같은 다수의 레이아웃과 해상도로 비디오를 생성할 수 있으며, 모션 강도 조절과 시드 기반 생성을 통해 반복 가능한 출력과 무작위 출력을 모두 지원합니다.

논란 속에서의 항해

Stable Video Diffusion의 출시는 기업이 비디오 기능을 통합하는 간소화된 방법을 제공하지만, 이는 안정적인 AI가 교육 데이터 출처에 대한 논란 속에서도 시장에서 입지를 다지기 위한 노력을 반영합니다. 최근 스탠포드 인터넷 관측소의 보고서에 따르면, 인기 AI 모델을 훈련시키기 위해 사용된 LAION-5B 데이터셋에 부적절한 자료가 포함되어 있어 삭제되었습니다. 또한 회사는 Stable Diffusion 생성을 위해 저작권이 있는 이미지의 권한 없이 취득했다는 이유로 집단소송에 직면해 있습니다.

현재 Stability AI의 개발자 플랫폼 API는 Stable Diffusion XL 텍스트-이미지 생성기와 새 SVD 모델을 포함한 모든 모델에 접근할 수 있도록 제공하고 있으며, 고객이 이러한 모델을 로컬에서 호스팅할 수 있는 멤버십 옵션도 제공합니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles