Stability AI, разработчик знаменитой системы текстового генерации изображений Stable Diffusion, представила свою первую инновационную модель генерации видео – Stable Video Diffusion. Эта передовая модель генеративного ИИ способна преобразовывать текстовые подсказки в динамичные видео. Пользователи могут просто ввести фразы, такие как «ракета взлетает в пустыне» или «волны разбиваются о берег», и наблюдать, как Stable Video Diffusion оживляет эти описания.
Кроме текстовых подсказок, модель может создавать видео на основе статичных изображений. Исследовательская группа, работающая над Stable Video Diffusion, специально разработала ее для высококачественной синтеза изображений в видео. Одной из ключевых особенностей является синтез с нескольких ракурсов, позволяющий аниматорам генерировать несколько ракурсов с одного объекта. Эта функция может быть неоценимой для разработчиков, создающих погружающие 3D-среды для приложений виртуальной (VR) и дополненной реальности (AR).
Как получить доступ к Stable Video Diffusion
В настоящее время Stable Video Diffusion доступна только для исследований. Разработчики отметили, что модель «не предназначена для реальных или коммерческих приложений на данном этапе». Вместо этого они сосредоточены на сборе отзывов о безопасности и производительности, чтобы улучшить модель для будущего использования.
Исследователи, заинтересованные в изучении Stable Video Diffusion, могут найти исходный код на GitHub, а необходимые веса для локального выполнения модели размещены на Hugging Face. Модель предлагает две различные опции генерации видео из изображений, способные создавать 14 и 25 кадров с настраиваемой частотой кадров от трех до 30 кадров в секунду.
Предварительные исследования, сравнивающие предпочтения пользователей, показывают, что Stable Video Diffusion получила положительные отзывы по сравнению с конкурентами из Pika Labs и Runway, подчеркивая ее потенциал в насыщенной сфере генерации видео.
Интересно, что пользователи могут записаться в лист ожидания, чтобы получить доступ к предстоящему веб-интерфейсу, демонстрирующему практическое применение Stable Video Diffusion в таких секторах, как образование, маркетинг и развлечения. Для того чтобы выразить интерес к этому инновационному опыту, пользователи должны выбрать «Stable Video – Лист ожидания» в выпадающем меню на форме обратной связи.
Stability AI продолжает расширять границы генеративных технологий, открывая новые возможности в генерации видео и создании креативного контента. По мере evolución этой модели, она обещает многообещающий потенциал для различных приложений в области богатого визуального повествования.