Google tuvo un impacto significativo en la Conferencia de Desarrolladores de Juegos (GDC) de este año, destacando el papel transformador de la inteligencia artificial generativa (Gen AI) en la industria del gaming. Una serie de presentaciones divididas en tres partes mostró las perspectivas de líderes de Google en el ámbito de los juegos y la IA, abordando las soluciones de desarrollo de IA de la compañía, la influencia de la IA en las experiencias de juego y consejos prácticos para los desarrolladores que deseen iniciar su propio camino en IA.
Gen AI permitiendo “Juegos Vivos”
“Los juegos están entrando en una nueva era,” declaró Jack Buser, Director de Juegos en Google Cloud, subrayando que los “juegos vivos” probablemente debutarán en los próximos tres a cinco años. Estos juegos combinarán modelos tradicionales de servicios en vivo con capacidades de IA generativa.
“En última instancia, los juegos responderán a las instrucciones implícitas o explícitas de los jugadores,” compartió. “Generarán contenido al instante para satisfacer las necesidades específicas de jugadores individuales o pequeños grupos. Pronto veremos desarrollos emocionantes de mis colegas en Google.”
Integrando Gen AI en el Desarrollo de Juegos
Muchas estudios de videojuegos ya están incorporando IA generativa en sus procesos de producción, utilizando herramientas como Vertex AI de Google Cloud para el desarrollo de juegos, localización y mejoras en las experiencias de juego. Buser señaló que algunos desarrolladores incluso están creando sus propios modelos de lenguaje de gran tamaño (LLMs), citando la colaboración de Google Cloud con NCSOFT para desarrollar su LLM VARCO.
La IA generativa también está revolucionando la publicación y distribución de juegos, explicó Lei Zhang, Director de Asociaciones de Juego en Google.
“Estamos pasando de simplemente distribuir juegos a manejar todo el ciclo de vida para desarrolladores y jugadores,” afirmó Zhang. “La IA generativa está mejorando el descubrimiento de juegos y apoyando a los desarrolladores en la creación de activos de marketing para la Play Store. En el futuro, las descripciones de las tiendas y los activos gráficos podrían generarse mediante IA.”
Gemini 1.5 Expandiendo el Potencial del Desarrollo de Juegos
Recientemente lanzado en más de 180 países, Gemini 1.5 Pro es el modelo multimodal de tamaño mediano de Google que optimiza tareas de texto, imagen, video, audio y codificación. Es capaz de procesar hasta 1 millón de tokens en producción (y 10 millones en entornos de laboratorio).
“Los modelos pueden mantener el contexto y generar respuestas coherentes,” comentó Tokumine. “Esto aborda desafíos significativos en la recuperación de información. Estoy emocionado de ver las posibilidades creativas que estos modelos desbloquearán.”
Google Cloud ofrece a los desarrolladores una plataforma segura y gestionada para datos, refinamiento de modelos y acceso a una vasta biblioteca de modelos de terceros, incluyendo más de 100,000 de una reciente colaboración con Hugging Face.
Desbloqueando LLMs para el Desarrollo de Juegos
Glenn Cameron, Gerente de Marketing de Producto en Google, exploró los beneficios de los LLMs en el desarrollo de juegos, enfatizando su capacidad para manejar consultas complejas y proporcionar respuestas matizadas, convirtiéndolos en asistentes creativos valiosos.
“Pueden servir como motores de inspiración para ayudar a superar bloqueos creativos, especialmente durante las etapas iniciales del desarrollo de juegos,” explicó Cameron. “Desde desarrollar misiones hasta historias de personajes, su potencial como colaboradores es transformador.”
Los modelos de texto a imagen y la tecnología DreamBooth de Google pueden visualizar personajes y entornos, generando imágenes a partir de descripciones textuales e incluso produciendo código basado en requisitos específicos. Con la innovadora ventana de contexto de 1 millón, modelos como Gemini 1.5 Pro pueden rastrear detalles de la trama y crear experiencias narrativas inmersivas, permitiendo que los NPCs participen en diálogos dinámicos basados en memoria.
El Modelo Abierto Ligero de Google para el Desarrollo
Google ofrece dos familias de modelos: Gemini y el recién lanzado Gemma, que es más ligero y accesible. Gemma está disponible en principales bibliotecas, incluyendo Keras, JAX, TensorFlow, PyTorch y Hugging Face. Viene en dos tamaños: 2 mil millones y 7 mil millones de parámetros, lo que lo hace adecuado para dispositivos locales así como potentes GPU de escritorio. Gemma también incluye un kit de herramientas de IA responsable para ayudar a los desarrolladores a garantizar experiencias de jugador seguras y agradables.
“Con gran poder viene una gran responsabilidad,” advirtió Cameron. “Entrenar en grandes conjuntos de datos puede introducir sesgos y toxicidad, lo que puede resultar en contenido peligroso. Los desarrolladores deben monitorear y gestionar estos riesgos.”
Iniciando con Gen AI para Juegos Vivos
En la presentación final, Dan Zaratsian y Giovane Moura Jr. demostraron cómo la IA generativa y Google Cloud pueden revolucionar las interacciones de los jugadores. Mostraron un juego multijugador construido sobre Google Kubernetes Engine (GKE), diseñado para la escalabilidad y la interoperabilidad de cargas de trabajo de IA a nivel global.
Spanner juega un papel crucial en el almacenamiento de embeddings para búsquedas rápidas, integrando datos estructurados para mejorar la consistencia del juego a nivel global. Al mantener la memoria a largo plazo, Spanner permite que los NPCs recuerden interacciones pasadas, aprovechando esta historia para respuestas más inteligentes y contextualizadas.
El Futuro de la IA Generativa en el Desarrollo de Juegos
Mirando hacia el futuro, nuevas herramientas y servicios seguirán reformando cómo los desarrolladores se involucran en la creación de juegos. El equipo de Google Cloud está desarrollando consultas federadas para mejorar los comportamientos de los NPCs, permitiendo interacciones de consultas complejas a través de múltiples puntos finales.
“Si combinas estos NPCs y LLMs de manera encadenada, puedes desbloquear mucho más potencial que los sistemas tradicionales de un solo paso,” concluyó Zaratsian.