Стабильная видеодиффузия теперь доступна через API Stability AI для улучшенного создания видео.

Stability AI, известная своим генератором текста в изображение Stable Diffusion, представила свою последнюю модель - Stable Video Diffusion (SVD). Эта модель теперь доступна через платформу разработчиков компании и интерфейс программирования приложений (API), что позволяет сторонним разработчикам интегрировать ее в свои приложения, веб-сайты и программные решения.

"Это новое дополнение предоставляет программный доступ к современному видеомодели, адаптированной для различных секторов. Наша цель - предоставить разработчикам эффективный способ для бесшовного внедрения передового видеогенерации в их продукты," - заявила компания в блоге.

Хотя этот релиз предлагает мощный инструмент для предприятий, стремящихся создавать видео с помощью ИИ, он также вызывает опасения. Stability AI недавно подверглась критике за использование набора данных LAION-5B, который содержал случаи неприемлемого контента и был удален из обращения.

Несмотря на эти проблемы, API SVD от Stability дает конкурентное преимущество в качестве видео. Согласно посту компании в LinkedIn, модель SVD может генерировать 2 секунды видео, включая 25 сгенерированных кадров и 24 кадра интерполяции FILM, всего за 41 секунду. Хотя этого может не хватить для крупных видеокампаний, это полезно для создания GIF и специфических сообщений, включая мемы.

SVD конкурирует с другими моделями генерации видео от Runway и Pika Labs, которые недавно привлекли 55 миллионов долларов финансирования и запустили новую платформу для редактирования видео. Однако, в отличие от Stability AI, эти варианты недоступны через API и требуют прямого доступа через их соответствующие сайты или приложения.

Кроме того, Stability AI планирует запустить веб-интерфейс для пользователей, чтобы упростить доступ к своему генератору видео, приглашая пользователей присоединиться к списку ожидания для раннего доступа.

Понимание Stable Video Diffusion

Представленный в исследовательском превью месяц назад, Stable Video Diffusion позволяет пользователям создавать MP4-видео из статичных изображений, таких как JPG и PNG. Поначалу модель может производить короткие клипы продолжительностью до двух секунд, несмотря на то, что она все еще находится на стадии разработки и предлагает меньшую продолжительность, чем некоторые исследовательские модели.

Тем не менее, несколько коротких клипов можно объединить для создания более длинных видео. Stability AI утверждает, что эта модель может быть полезна в таких секторах, как реклама, маркетинг, телевидение и кино, а также игровые разработки.

Важно отметить, что новейшая модель может генерировать видео в нескольких компоновках и разрешениях, включая 1024×576, 768×768 и 576×1024. Также она предлагает управление силой движения и основанное на семени создание, позволяя генерировать как повторяемые, так и случайные выходные данные.

Навигация по спорным вопросам

Хотя запуск Stable Video Diffusion предлагает упрощенный способ для бизнеса интегрировать видеовозможности, он подчеркивает приверженность Stability AI закрепиться на рынке на фоне продолжающихся споров относительно источников данных для обучения.

Недавний отчет Стэнфордского интернет-обсерватории выявил, что набор данных LAION-5B, используемый для обучения популярных моделей ИИ, содержал случаи неприемлемого контента, что привело к его удалению. Кроме того, компания сталкивается с коллективным иском за предполагаемое приобретение изображений с авторским правом без разрешения для создания Stable Diffusion.

В настоящее время API платформы разработчиков Stability AI предлагает доступ ко всем её моделям, включая генератор текста в изображение Stable Diffusion XL и новую модель SVD. Компания также предлагает опцию членства для клиентов, позволяя хостить эти модели локально.

Most people like

Find AI tools in YBX