Google представила модель Genie с 11 миллиардами параметров: преобразование изображений в игровые виртуальные миры.

Home Новости ИИ Google представила модель Genie с 11 миллиардами параметров: преобразование изображений в игровые виртуальные миры.

Updated on февраль 28 2024

Команда Google DeepMind недавно представила Genie — базовую модель мира с 11 миллиардами параметров, способную преобразовывать одно изображение в интерактивный виртуальный мир. Эта прорывная технология привлекла значительное внимание и знаменует собой важный момент, когда искусственный интеллект входит в сферу видеоигр.

В отличие от предыдущих моделей, Google Genie обучается на 200,000 часов неразмеченных видеоматериалов из интернета без необходимости в контролируемом обучении, что позволяет ему генерировать разнообразные сцены. Genie может также распознавать главных персонажей в сцене без действиям меток, что открывает возможности для взаимодействия пользователя и подчеркивает его огромный потенциал в создании виртуальных пространств.

В основе возможностей Genie лежат три ключевых компонента: модель скрытых действий, токенизатор видео и авторегрессивная динамическая модель. Эти элементы совместно формируют скрытое пространство действий, которое обогащает взаимодействие пользователей и позволяет агентам воспроизводить невидимое поведение из видео.

Кроме того, Genie поддерживает инновационное использование человеческих эскизов или реальных изображений. С применением продвинутых моделей генерации текста в изображение Genie может преобразовать начальный кадр в интерактивную виртуальную вселенную, значительно расширяя свою функциональность.

Тим Роктэшель, глава команды Genie, подчеркивает, что Genie представляет собой важный шаг в развитии искусственного общего интеллекта (AGI), который готов изменить ландшафт интерактивных генеративных сред и заложить основу для будущих достижений в области ИИ.

В заключение, модель Genie от Google DeepMind предвосхищает революционный сдвиг в индустрии видеоигр. Ее способность создавать играбельные виртуальные миры из одного изображения сигнализирует о грядущей массовой интеграции ИИ в игровую сферу.

Сравнение Google Genie и OpenAI Sora: Подробный анализ и оценка моделей генерации интерактивного видео

Подход Sora к сложному визуальному контенту: раскрытие секретов пространственно-временного патчинга

Most people like

Theneo

78.7K

Theneo — это инновационный инструмент на основе ИИ, разработанный для оптимизации процесса документирования и интеграции API, что упрощает разработчикам подключение и эффективное сотрудничество.

Документация API AI API Design

GPTZero

9.4M

GPTZero предназначен для обнаружения текста, созданного ИИ, повышая прозрачность за счет четкого разграничения контента, созданного людьми, и созданного искусственным интеллектом.

Обнаружение ИИ AI Content Detector

Ropes AI

15.7K

Оценивайте кандидатов на инженерные позиции так, как если бы проводили очное интервью, используя оценки кодирования на базе ИИ для повышения эффективности отбора.

Оценка на основе ИИ AI Recruiting

Suno AI Music Prompt Generator

102.3K

Ищете, как разжечь свою музыкальную вдохновение? Откройте силу превращения ваших идей в завораживающие музыкальные подсказки. Занимаясь своими мыслями, вы можете легко создавать уникальные темы и мелодии, которые резонируют с вами. Будь вы начинающим музыкантом или опытным композитором, этот инструмент поможет вам направить ваше воображение в красивую музыку. Начните создавать сегодня!

ИИ AI Music Generator

Find AI tools in YBX