Google представляет новые модели создания контента с использованием ИИ: подробности о Veo и Imagen 3.

На конференции Google I/O в этом году компания Google представила свои последние двигатели для создания медиа с использованием ИИ — Veo и Imagen 3. Veo способен производить высококачественные видео в формате 1080p, тогда как Imagen 3 представляет собой новейшую платформу для генерации изображений на основе текста. Несмотря на то что эти продукты могут не произвести революцию в индустрии, они помогают Google сохранять конкурентное преимущество перед видео-моделью Sora от OpenAI и DALL-E 3.

Google утверждает, что Veo обладает «глубоким пониманием естественного языка и визуальной семантики», что позволяет ему создавать видео длительностью более одной минуты на основе описаний пользователей. Также он осознает концепции, связанные с кинопроизводством и визуальными технологиями, такие как таймлапс, которые стали ключевыми для моделей генерации видео с использованием ИИ.

Чтобы продемонстрировать возможности Veo, Google сотрудничала с Дональдом Гловером и его креативной студией Gilga для производства рекламного видео с эпизодами поездки на кабриолете и парусной регатой, которые были сгенерированы на основе текстовых описаний. По заявлению Google, Veo превосходит предыдущие модели в симуляции реальных физических явлений и создании высококачественной графики. Гловер отметил в видео: «Каждый должен быть режиссером; рассказывание историй друг друга обогатит наше понимание».

Хотя пока неясно, примет ли аудитория видео, созданные ИИ — управляемые главным образом любопытством к тому, как машины воссоздают человеческое искусство — это не остановило Google и OpenAI от продвижения своих инструментов. Veo уже доступен в инструменте VideoFX для избранных создателей и планирует запуск на платформах, таких как YouTube Shorts. После интеграции в YouTube Shorts это может значительно укрепить конкурентные позиции Google против TikTok.

Что касается Imagen 3, Google заявляет, что это «модель самого высокого качества» для генерации изображений из текста, создающая «реалистичные и живые» изображения с минимальными артефактами. Настоящая задача заключается в сравнении с DALL-E 3, и Google утверждает, что Imagen 3 умнее при работе с текстом и более длинными подсказками.

Кроме того, Google сотрудничает с музыкальными исполнителями Уайклефом Жаном и Бьорном для тестирования инструмента музыкального ИИ, разработанного для помощи в создании песен и ритмов. Хотя представленный контент пока был кратким, он продемонстрировал несколько интересных примеров.

От рассветов до старения человека, ИИ становится все более интеллектуальным. Новейшие инструменты создания медиа от Google движутся в этом направлении. С миллиардами, вложенными в ИИ, Google стремится возглавить следующий прорыв в вычислительной технологии. Будущий потенциал этих технологий для улучшения жизни или создания душевного искусства остается важной темой для обсуждения.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles