Google hatte auf der diesjährigen Game Developer Conference (GDC) einen bedeutenden Einfluss und hob die transformative Rolle der generativen KI (Gen AI) in der Spieleindustrie hervor. Eine dreiteilige Präsentationsreihe bot Einblicke von Google-Führungskräften im Bereich Gaming und KI, die die Lösungen des Unternehmens zur KI-Entwicklung, den Einfluss von KI auf Spielerlebnisse und praktische Ratschläge für Entwickler erörterten, die eigene KI-Projekte starten möchten.
Gen AI ermöglicht „lebendige Spiele“
„Spiele betreten eine neue Ära“, erklärte Jack Buser, Direktor für Spiele bei Google Cloud, und wies darauf hin, dass „lebendige Spiele“ voraussichtlich in den nächsten drei bis fünf Jahren Premiere feiern werden. Diese Spiele werden traditionelle Live-Service-Modelle mit generativen KI-Fähigkeiten kombinieren.
„Letztendlich werden Spiele auf die impliziten oder expliziten Anweisungen der Spieler reagieren“, teilte er mit. „Sie werden Inhalte in Echtzeit generieren, um die spezifischen Anforderungen einzelner Spieler oder kleiner Gruppen zu erfüllen. Erwarten Sie bald spannende Entwicklungen von meinen Kollegen bei Google.“
Integration von Gen AI in die Spieleentwicklung
Viele Studios integrieren bereits generative KI in ihre Produktionsabläufe und nutzen Tools wie Google Cloud’s Vertex AI für die Spielentwicklung, Lokalisierung und zur Verbesserung von Spieleerlebnissen. Buser bemerkte, dass einige Entwickler sogar eigene große Sprachmodelle (LLMs) erstellen, und nannte die Zusammenarbeit von Google Cloud mit NCSOFT zur Entwicklung des VARCO LLM.
Generative KI revolutioniert auch das Spiele-Publishing und die Distribution, erklärte Lei Zhang, Direktor für Play Partnerships bei Google.
„Wir wechseln von der reinen Distribution von Spielen zu einem umfassenden Management des gesamten Lebenszyklus für Entwickler und Spieler“, sagte Zhang. „Generative KI verbessert die Spielentdeckung und unterstützt Entwickler dabei, Marketingmaterialien für den Play Store zu erstellen. In Zukunft könnten Store-Beschreibungen und grafische Assets von KI generiert werden.“
Simon Tokumine, Direktor des Produktmanagements bei Google AI, fügte hinzu: „Generative KI hat das Potenzial, jeden Aspekt des Gaming-Geschäfts zu transformieren. Unsere hochmodernen Modelle auf unserem Labs-Portal sind darauf ausgelegt, kreative Arbeitsabläufe zu optimieren.“ Er verwies auf Kollaborationen mit Künstlern wie Lupe Fiasco und Dan Deacon, die KI nutzen, um Kreativität zu inspirieren und Live-Darbietungen zu verbessern.
Gemini 1.5 erweitert das Potenzial der Spieleentwicklung
Kürzlich in über 180 Ländern eingeführt, ist Gemini 1.5 Pro Googles mittelgroßes multimodales Modell, das Texte, Bilder, Videos, Audio und Programmieraufgaben optimiert. Es kann bis zu 1 Million Tokens in der Produktion (und 10 Millionen in Laboreinstellungen) verarbeiten.
„Die Modelle können den Kontext beibehalten und kohärente Antworten generieren“, sagte Tokumine. „Das adressiert bedeutende Herausforderungen in der Informationsbeschaffung. Ich bin gespannt auf die kreativen Möglichkeiten, die diese Modelle eröffnen werden.“
Google Cloud bietet Entwicklern eine sichere, verwaltete Plattform für Daten, Modellverfeinerung und Zugriff auf eine umfangreiche Bibliothek von Drittanbieter-Modellen, darunter über 100.000 aus einer kürzlichen Partnerschaft mit Hugging Face.
LLMs für die Spieleentwicklung nutzen
Glenn Cameron, Produktmarketing-Manager bei Google, erörterte die Vorteile von LLMs in der Spieleentwicklung und hob ihre Fähigkeit hervor, komplexe Anfragen zu bearbeiten und differenzierte Antworten zu geben, was sie zu wertvollen kreativen Assistenten macht.
„Sie können als Inspirationsmotoren dienen, um kreative Blockaden zu überwinden, insbesondere in den frühen Phasen der Spieleentwicklung“, erklärte Cameron. „Vom Ausarbeiten von Quests bis hin zu Charaktergeschichten ist ihr Potenzial als Kollaborateure transformativ.“
Text-zu-Bild-Modelle und Googles DreamBooth-Technologie können Charaktere und Umgebungen visualisieren, Bilder aus Textbeschreibungen generieren und sogar Code basierend auf spezifischen Anforderungen produzieren. Mit dem bahnbrechenden 1-Millionen-Kontextfenster können Modelle wie Gemini 1.5 Pro Lore-Details verfolgen und immersive narrative Erlebnisse schaffen, die es NPCs ermöglichen, an gedächtnisgestützten, dynamischen Dialogen teilzunehmen.
Googles leichtgewichtiges Open Model für die Entwicklung
Google bietet zwei Modellfamilien an: Gemini und das neu veröffentlichte Gemma, das leichter und zugänglicher ist. Gemma ist in allen wichtigen Bibliotheken wie Keras, JAX, TensorFlow, PyTorch und Hugging Face verfügbar. Es kommt in zwei Größen – mit 2 Milliarden und 7 Milliarden Parametern – und ist somit für lokale Geräte sowie leistungsstarke Desktop-GPUs geeignet. Gemma enthält auch ein verantwortungsvolles KI-Toolkit, um Entwicklern zu helfen, sichere und angenehme Spielerlebnisse zu gewährleisten.
„Mit großer Macht kommt große Verantwortung“, warnte Cameron. „Das Training mit großen Datensätzen kann Vorurteile und Toxizität einführen, was zu gefährlichen Inhalten führen kann. Entwickler müssen diese Risiken überwachen und managen.“
Start mit Gen AI für lebendige Spiele
In der abschließenden Präsentation zeigten Dan Zaratsian und Giovane Moura Jr., wie generative KI und Google Cloud die Interaktionen der Spieler revolutionieren können. Sie präsentierten ein Mehrspieler-Spiel, das auf Google Kubernetes Engine (GKE) basiert und für Skalierbarkeit und Interoperabilität über AI-Workloads weltweit entwickelt wurde.
Spanner spielt eine entscheidende Rolle bei der Speicherung von Einbettungen für schnelle Abfragen und integriert strukturierte Daten zur Verbesserung der globalen Konsistenz des Spiels. Indem Spanner über längere Zeiträume Erinnerungen speichert, können NPCs frühere Interaktionen abrufen und diese Historie für intelligentere und kontextbewusste Antworten nutzen.
Die Zukunft der generativen KI in der Spieleentwicklung
In der Zukunft werden neue Tools und Dienstleistungen weiterhin die Art und Weise, wie Entwickler mit der Spielentwicklung interagieren, neu gestalten. Das Google Cloud-Team entwickelt föderierte Abfragen zur Verbesserung des Verhaltens von NPCs, die komplexe Abfrageinteraktionen über mehrere Endpunkte hinweg ermöglichen.
„Wenn Sie diese NPCs und LLMs in einer verketteten Weise kombinieren, können Sie weit mehr Potenzial freisetzen als herkömmliche Ein-Pass-Systeme“, schloss Zaratsian.