谷歌在今年的游戏开发者大会(GDC)上产生了重大影响,强调了生成式人工智能(Gen AI)在游戏行业中的变革作用。此次会议中,谷歌的游戏与人工智能领导者们通过三场演讲分享了他们的见解,讨论了公司的AI开发解决方案、AI对游戏内体验的影响,以及有意投身AI的开发者们的实用建议。
Gen AI引领“活游戏”的时代
谷歌云游戏总监杰克·布泽(Jack Buser)表示:“游戏正进入一个新纪元。”他指出,“活游戏”将在未来三到五年内面世,这些游戏将结合传统的实时服务模式和生成式AI能力。他强调:“最终,游戏将能够根据玩家的隐性或显性指令做出反应,为个别玩家或小组生成内容。期待谷歌团队带来的激动人心的进展。”
将Gen AI融入游戏开发
许多游戏工作室已开始在制作流程中应用生成式AI,如利用谷歌云的Vertex AI工具进行游戏开发、本地化及提升游戏内体验。布泽提到,一些开发者甚至在创建自己的大语言模型(LLMs),例如谷歌云与NCSOFT合作开发的VARCO LLM。
生成式AI还在革新游戏发行与分销,谷歌游戏合作总监张磊解释道:“我们正在从单纯的游戏分发转变为为开发者和玩家管理整个生命周期。”他表示,生成式AI正在提升游戏发现的效率,并支持开发者创建Play商店的营销素材。将来,商店描述和图形素材可能都由AI生成。
谷歌AI产品管理总监西蒙·德库米奈(Simon Tokumine)补充道:“生成式AI有潜力彻底改变游戏行业的各个方面。我们在Labs门户上推出的先进模型旨在提升创意工作流程。”他提到与许多艺术家如卢佩·菲亚斯科(Lupe Fiasco)和丹·迪肯(Dan Deacon)的合作,他们利用AI来激发创意并提升现场表演。
Gemini 1.5扩展游戏开发潜力
最新推出的Gemini 1.5 Pro在超过180个国家上市,是谷歌中型多模态模型,优化文本、图像、视频、音频和编码任务,能够处理多达100万的tokens(在实验环境中可达1000万)。德库米奈表示:“这些模型可以保持上下文,生成连贯的响应,解决信息检索中的诸多挑战。我期待看到这些模型所能解锁的创意可能。”
谷歌云为开发者提供了安全的托管平台,用于数据管理、模型优化,以及访问超过10万个第三方模型,这些模型来自最近与Hugging Face的合作。
解锁大语言模型(LLMs)用于游戏开发
谷歌产品营销经理格伦·卡梅伦(Glenn Cameron)探讨了LLMs在游戏开发中的优势,强调它们处理复杂查询和提供细腻回应的能力,这使它们成为宝贵的创意助手。他解释道:“它们可以作为灵感引擎,帮助开发者克服创意障碍,特别是在游戏开发的早期阶段。从丰富任务到角色故事,其作为合作伙伴的潜力是变革性的。”
文本到图像模型和谷歌的DreamBooth技术可以将角色和环境可视化,从文本描述生成图像,甚至根据特定需求生成代码。凭借创新的100万上下文窗口,像Gemini 1.5 Pro这样的模型可以追踪背景细节,创建沉浸式叙事体验,让NPC能够进行基于记忆的动态对话。
谷歌轻量化开放模型的发展
谷歌提供了两种模型系列:Gemini和新发布的Gemma,后者更轻便且更易获取。Gemma可在主要库中使用,包括Keras、JAX、TensorFlow、PyTorch和Hugging Face。其模型参数有20亿和70亿两个版本,适合本地设备与强大的桌面GPU使用。此外,Gemma还配备了负责任的AI工具包,帮助开发者确保安全和愉悦的玩家体验。
卡梅伦对此警告道:“强大的力量伴随巨大的责任。训练于庞大的数据集可能引入偏见与毒性内容,造成潜在危险。开发者必须监控并管理这些风险。”
从Gen AI开启“活游戏”之旅
在最后的演讲中,丹·扎拉齐安(Dan Zaratsian)和吉奥瓦尼·莫拉(Giovane Moura Jr.)展示了生成式AI与谷歌云如何彻底改变玩家互动。他们展示了一款基于谷歌Kubernetes引擎(GKE)构建的多人游戏,旨在实现跨AI工作负载的可扩展性和互操作性。
Spanner在存储嵌入向量以快速查找方面发挥了关键作用,集成了结构数据以增强全球游戏一致性。通过保持长期记忆,Spanner使得NPC能够回忆过去的互动,利用这些历史记录提供更智能和情境感知的回应。
生成式AI在游戏开发中的未来
展望未来,新工具和服务将继续塑造开发者与游戏创作的互动方式。谷歌云团队正在开发联合查询,以增强NPC的行为,使其能够在多个端点间进行复杂的查询互动。“如果将这些NPC与LLMs以链接方式结合使用,便能释放出远超传统单通道系统的潜力,”扎拉齐安总结道。