加州大学伯keley分校的研究人员开发了一种创新的人形机器人控制系统,使其能够熟练地在多样的地形和障碍物中导航。该系统基于人工智能,受到了深度学习框架的启发。这一系统的核心原则十分简单:通过分析近期观察,人工智能能够预测未来的状态和动作。
该系统在完全模拟的环境中进行训练,表现出在不可预测的实际条件下的强大性能。通过评估过去的互动,它能够动态调整行为,以有效应对训练中未曾遇到的新场景。
万能机器人
人形机器人旨在模仿人类,有潜力成为能执行各种物理和认知任务的宝贵助手。然而,创造多功能的人形机器人面临重大挑战,尤其是在开发灵活的控制系统时。
传统的机器人控制系统通常缺乏适应性,它们针对特定任务而设计,难以应对现实世界的不可预测性和视觉条件。这种局限性使它们的应用仅限于受控环境。因此,越来越多的人开始关注基于学习的机器人控制方法。这些系统能够根据从模拟或直接环境交互中收集的数据调整其行为。
来自加州大学伯keley分校的控制系统承诺能够灵活地引导人形机器人应对各种场景。该系统已成功应用于全尺寸通用人形机器人Digit,展现了其卓越的户外行走能力,能够可靠地在日常人类环境中如人行道、步道和开阔地带导航。机器人能够熟练地穿越混凝土、橡胶和草地等多种表面,自如行走而不摔倒。
研究人员表示:“我们发现我们的控制器能够稳定地在所有测试的地形上行走,并且可以在没有安全支架的情况下进行部署。在为期一周的户外测试中,没有观察到任何摔倒的情况。”
此外,该机器人经过严格测试,展示了对干扰的抵抗能力。它能够有效处理意外的台阶、路径中的随机物体,甚至抵御投掷物,保持稳定性,即使在被推或拉的情况下。
变压器控制技术
虽然各种人形机器人展示了令人印象深刻的能力,但这一新系统在训练和部署方法上独树一帜。
该人工智能控制模型完全在模拟环境中训练,利用数千个领域和数十亿个场景,通过Isaac Gym—一个高性能物理模拟环境进行训练。这种广泛的模拟经验能够无缝转移到现实应用中,而无需额外的微调,称为“模拟到现实转移”。值得注意的是,该系统在现实场景中表现出超出预期的能力,例如能够顺利走过训练中未明确覆盖的楼梯。
该系统的核心是一个“因果变压器”,这是一个处理历史自我感知观测和行为的深度学习模型。这个变压器有效地识别特定信息的相关性,例如步态模式和接触状态,这些都是机器人观测所需的重要信息。
因果变压器利用观察和行为的序列进行学习,使其能够预测行为的后果,动态适应不同的地形,即便是陌生的环境。研究人员表示:“我们假设观察和行为的历史隐含编码了关于世界的信息,强大的变压器模型能够在测试时动态调整其行为。”这种概念被称为“上下文适应”,与语言模型如何利用上下文信息学习新任务并在推理过程中优化输出相似。
变压器已被证明在处理序列模型时优于其他模型,例如时间卷积网络(TCN)和长短期记忆网络(LSTM)。其架构支持通过附加数据和计算资源进行扩展,并且可以通过集成各种输入模态来增强功能。
在过去的一年中,变压器已成为机器人社区中的重要工具,多种模型利用其多功能性来提升机器人能力。它们提供了显著的好处,包括改善不同模态的数据编码,以及将高级自然语言指令转化为具体的机器人规划步骤。
研究人员总结道:“与视觉和语言等领域类似,我们相信变压器将为我们在现实人形机器人步态学习方法的扩展提供助力。”