На этой year's Game Developer Conference (GDC) Google произвел значительное впечатление, подчеркнув трансформационную роль генеративного ИИ (Gen AI) в игровой индустрии. Серия из трех презентаций предложила идеи от руководителей Google в области игр и ИИ, обсуждая решения компании по разработке ИИ, влияние ИИ на игровые процессы и практические советы для разработчиков, желающих начать свои собственные проекты в области ИИ.
Генеративный ИИ в “Живых Играх”
“Игры вступают в новую эру,” заявил Джек Бузер, директор Google Cloud по играм, отметив, что “живые игры” вероятно появятся в течение ближайших трех-четырех лет. Эти игры объединят традиционные модели обслуживания с возможностями генеративного ИИ.
“В конечном итоге игры будут реагировать на явные и неявные инструкции игроков,” поделился он. “Они будут создавать контент на лету, чтобы удовлетворять специфические потребности отдельных игроков или небольших групп. Ожидайте захватывающих новостей от моих коллег в Google в ближайшее время.”
Интеграция Gen AI в разработку игр
Многие игровые студии уже используют генеративный ИИ в своих производственных процессах, применяя инструменты, такие как Vertex AI от Google Cloud для разработки игр, локализации и улучшения игровых впечатлений. Бузер отметил, что некоторые разработчики даже создают собственные большие языковые модели (LLMs), упомянув сотрудничество Google Cloud с NCSOFT для разработки VARCO LLM.
Генеративный ИИ также революционизирует публикацию и распространение игр, объяснил Лей Чжан, директор Play Partnerships в Google.
“Мы переходим от простого распространения игр к управлению полным циклом для разработчиков и игроков,” заявил Чжан. “Генеративный ИИ улучшает поиск игр и помогает разработчикам создавать маркетинговые материалы для Play Store. В будущем описания в магазинах и графические активы могут генерироваться ИИ.”
Gemini 1.5 расширяет возможности разработки игр
Недавно запущенный в более чем 180 странах, Gemini 1.5 Pro — это средний мультимодальный модель Google, оптимизирующая задачи текста, изображения, видео, аудио и кодирования. Она способна обрабатывать до 1 миллиона токенов в производстве (и до 10 миллионов в лабораторных условиях).
“Модели могут поддерживать контекст и генерировать последовательные ответы,” сказал Токумине. “Это решает значительные проблемы извлечения информации. Мне интересно увидеть творческие возможности, которые эти модели откроют.”
Google Cloud предлагает разработчикам безопасную управляемую платформу для данных, уточнения моделей и доступа к обширной библиотеке сторонних моделей, включая более 100,000 из недавнего партнерства с Hugging Face.
Открытие LLM для разработки игр
Гленн Кэмерон, менеджер по продуктам в Google, изучил преимущества LLM в разработке игр, подчеркнув их способность обрабатывать сложные запросы и обеспечивать детализированные ответы — что делает их ценными помощниками в креативной работе.
“Они могут служить источниками вдохновения для преодоления творческих блоков, особенно на ранних стадиях разработки игры,” объяснил Кэмерон. “От детализации квестов до историй персонажей, их потенциал как сотрудничество трансформируя.”
Модели текст-в-изображение и технология DreamBooth от Google могут визуализировать персонажей и окружение, создавая изображения по текстовым описаниям и даже генерируя код на основе конкретных требований. Благодаря революционному контекстному окну в 1 миллион токенов, такие модели, как Gemini 1.5 Pro, могут отслеживать детали лора и создавать увлекательные нарративные опыты, позволяя NPC участвовать в диалогах, основанных на памяти.
Легкая открытая модель для разработки от Google
Google предлагает две семейства моделей: Gemini и новейшую Gemma, которая легче и более доступна. Gemma доступна в основных библиотеках, включая Keras, JAX, TensorFlow, PyTorch и Hugging Face. Она представлена в двух размерах — на 2 миллиарда и 7 миллиардов параметров, что делает ее подходящей как для локальных устройств, так и для мощных настольных GPU. Gemma также включает в себя инструменты ответственного ИИ, чтобы помочь разработчикам обеспечить безопасный и приятный игровой опыт.
“С великой силой приходит великая ответственность,” предостерег Кэмерон. “Обучение на больших данных может ввести некоторые предвзятости и токсичность, что может привести к опасному контенту. Разработчики должны следить за этими рисками.”
Начало работы с Gen AI для живых игр
В финальной презентации Дан Зарациан и Жоване Моура мл. продемонстрировали, как генеративный ИИ и Google Cloud могут изменить взаимодействие игроков. Они представили многопользовательскую игру, построенную на Google Kubernetes Engine (GKE), предназначенную для масштабируемости и совместимости между рабочими нагрузками ИИ по всему миру.
Spanner играет ключевую роль в хранении внедрений для быстрого поиска, интегрируя структурированные данные для улучшения глобальной согласованности игры. Поддерживая долгосрочную память, Spanner позволяет NPC запоминать прошлые взаимодействия, используя эту историю для более умных и контекстуально осведомленных ответов.
Будущее генеративного ИИ в разработке игр
Смотрим в будущее, новые инструменты и услуги будут продолжать трансформировать процесс создания игр для разработчиков. Команда Google Cloud разрабатывает федеративные запросы для улучшения поведения NPC, позволяя сложные взаимодействия запросов через несколько конечных точек.
“Если вы объедините этих NPC и LLM в цепочном порядке, вы сможете разблокировать гораздо больше возможностей, чем в традиционных системах с единым проходом,” заключил Зарациан.