谷歌发布110亿参数的Genie模型：将图像转变为可玩虚拟世界

Home AI News CN 谷歌发布110亿参数的Genie模型：将图像转变为可玩虚拟世界

谷歌深Mind团队最近揭晓了Genie，一个拥有110亿参数的基础世界模型，能够将单一图像转化为互动的虚拟世界。这项突破性技术引起了广泛关注，标志着人工智能迈入视频游戏的新阶段。

与以往模型不同，谷歌Genie从20万小时的未标记互联网视频中学习，而无需监督训练，使其能够生成丰富多样的场景。它还可以在没有动作标签的情况下识别场景中的主要角色，增强用户互动，展示出在虚拟环境创建方面的巨大潜力。

Genie的能力源于三个核心组件：潜在动作模型、视频标记器和自回归动态模型。这些元素协同工作，发展出一种潜在的动作空间，以丰富用户互动，并使智能体能够模仿视频中未见过的行为。

此外，Genie还支持融入人类设计的草图或真实图像。利用先进的文本生成图像模型，Genie可以将初始画面转化为互动的虚拟宇宙，大幅扩展其应用可能性。

Genie团队负责人Tim Rocktäschel强调，Genie是人工通用智能（AGI）发展中的一个关键步骤，预计将重新塑造互动生成环境的前景，并为未来的人工智能发展奠定基础。

总之，谷歌深Mind推出的Genie模型预示着视频游戏行业的革命性转变。其从单一图像生成可玩虚拟世界的能力，标志着人工智能将广泛应用于游戏产业的未来。

生成性人工智能类型与排名全面分析：深入了解AI类别及其表现的指南

索拉的复杂视觉内容解析：揭示时空拼贴的秘密

Most people like

Anki Decks

138.6K

10倍速闪卡制作秘籍在学习和记忆的过程中，闪卡是一种极为有效的工具。通过高效的闪卡制作技巧，您可以将学习速度提升至10倍！本指南将揭示如何运用智能策略快速创建闪卡，帮助您更好地掌握知识点，提高学习效率。不论您是在学习新语言、备考考试，还是希望加深对某个主题的理解，这些实用的技巧都将大大提升您的学习体验。准备好踏上提升学习效率的旅程了吗？

安基 AI AI 笔记助手

Bing Image Creator

89.5K

探索由人工智能技术支持的迪士尼和皮克斯电影海报生成。这一创新不仅提升了视觉效果，更为电影宣传带来了新的可能性。

人工智能图像创作 AI海报生成器

Faceless

483.1K

使用Faceless将文字转化为引人入胜的视频，借助TikTok迅速扩展您的粉丝基础。

内容创作 AI Tiktok助手

OpenAI Text To Speech WebUI

免费在线文本转语音工具，让您轻松将文字转换为语音。无论是用于学习、演示还是内容创作，这些工具都能为您提供高质量的音频输出。轻松访问，快速转换，让您的文字生动起来！

OpenAI API 其他

Find AI tools in YBX