Google представил Veo: впечатляющую новую модель генеративного ИИ-видео, которая будет конкурировать с Sora от OpenAI.

Home Новости ИИ Google представил Veo: впечатляющую новую модель генеративного ИИ-видео, которая будет конкурировать с Sora от OpenAI.

С момента представления моделью генеративного ИИ Sora от OpenAI в начале этого года, немногие конкуренты смогли сопоставить её реализм и качество — до сих пор.

На своей ежегодной конференции разработчиков I/O Google анонсировала Veo, новую модель генеративного ИИ для создания видео, разработанную её известным подразделением DeepMind.

По словам Google, Veo способна генерировать «высококачественные клипы в 1080p продолжительностью более 60 секунд». На странице DeepMind в X сообщается, что модель охватывает различные кинематографические стили, от фотореализма и сюрреализма до анимации.

Google заявляет, что Veo стремится «сделать видеопроизводство доступным для всех», будь то опытные filmmakers, начинающие создатели или educators. Veo поддерживает преобразования текст-видео, видео-видео и изображение-видео.

В сотрудничестве с многогранным художником Дональдом Гловером, известным как Childish Gambino, Google протестировала новые функции Veo в его креативной студии Gilga.

Для демонстрации впечатляющих возможностей Veo DeepMind представила несколько сгенерированных видео на своих аккаунтах YouTube и X, где были показаны сцены неонового города, реалистичных медуз, ковбоев на лошадях, космических кораблей и человеческих взаимодействий. Результаты близки к живым съемкам и искусно выполненной анимации, созданной на основе простых текстовых подсказок.

В блоге вице-президента Google Эли Коллинза и старшего директора исследований Дугласа Эка подчеркивается, что Veo обладает «непревзойденным уровнем творческого контроля», с хорошим пониманием кинематографических терминов, таких как «таймлапс» и «аэрофотосъемка».

Кроме того, Veo позволяет быстро и качественно редактировать как сгенерированные ИИ, так и загруженные пользователем видео, включая предварительно записанный контент. Например, пользователи могут ввести команду редактирования, добавив каяки в аэрофотосъемку побережья, и Veo безупречно внедрит это в оригинальное видео.

Veo также отличается высокой последовательностью кадров, что устраняет некоторые несоответствия, часто встречающиеся в других моделях, включая Sora. Это достигается за счет современных трансформеров латентной диффузии, которые обеспечивают когерентность и реалистичность персонажей и объектов.

Для повышения производительности Google улучшила аннотации обучающих данных и использовала качественные сжатые видеопредставления. Эта оптимизация повышает общее качество видео и сокращает время генерации.

Все видео, создаваемые Veo, имеют встроенный SynthID, водяной знак контент-креденцирования от Google, подтверждающий их статус генерации ИИ.

Veo является результатом многолетних исследований DeepMind, основанных на предыдущих инновациях, таких как Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet и Lumiere.

В настоящее время Veo недоступна для широкой публики. Следуя модели OpenAI с Sora, она доступна для избранных создателей через частный превью в VideoFX. Google планирует в конечном итоге интегрировать некоторые функции Veo в YouTube Shorts и другие продукты.

Как снижение затрат на инференс LLM с помощью переноса внимания позволяет масштабироваться

Google представляет Imagen 3: совершенная модель текст-к-изображению теперь в приватном предварительном просмотре.

Most people like

Visily

473.2K

Узнайте о самом быстром способе легко создавать потрясающие каркасы и прототипы.

прототипирование AI Website Designer

Tripo 3D

577.3K

Преобразуйте одно изображение в потрясающие 3D-ресурсы мгновенно! Этот инновационный процесс позволяет вам повысить качество ваших творческих проектов, без труда превращая плоские визуалы в динамические трехмерные модели. Независимо от того, являетесь ли вы художником, разработчиком игр или создателем контента, эта технология улучшает ваш рабочий процесс и быстро и точно реализует ваши идеи.

3D моделирование AI Product Description Generator

CartoonGen

16.2K

Откройте магию генерации мультфильмов на основе ИИ с нашими инновационными инструментами, которые превращают текст или изображения в потрясающие анимации в стиле Pixar. Эта захватывающая технология позволяет создавать ярких и увлекательных персонажей и сцены, отражающие игривое очарование фильмов Pixar, оживляя ваши идеи как никогда раньше. Независимо от того, ищете ли вы вдохновение в качестве создателя или просто хотите развлечься, погружайтесь в мир мультфильмов в стиле Pixar на основе ИИ уже сегодня!

Генератор AI-карактера AI Photo & Image Generator

Fotor

15.6M

Откройте для себя удобный онлайн-фоторедактор, который предлагает широкий выбор мощных функций и инструментов для легкого улучшения ваших изображений.

редактор фотографий AI Photo Enhancer

Find AI tools in YBX