今天,Mentee Robotics,这家由Mobileye和AI21 Labs创始人Amnon Shashua共同创立的初创公司,已经走出隐匿模式,发布了其最新创新——Menteebot,一款由人工智能驱动的人形机器人。
目前处于原型阶段的Menteebot,专为家庭和仓库应用设计,利用包括OpenAI的ChatGPT所倡导的基于变压器的大型语言模型(LLMs)在内的先进AI技术。这种方法使得机器人能够在各个功能层面上有效运作。
次世代AI代理的诞生
Menteebot是一款以AI为核心设计的机器人,能够从头到尾完成复杂任务。与许多将AI整合到现有系统中的竞争对手不同,Mentee Robotics从零开发Menteebot,始终坚持AI优先的设计理念。
公司发布了一段视频,展示了Menteebot在接收口头指令后的反应,展示其在执行任务时的移动、场景理解、目标检测和抓取能力。
Menteebot的独特之处
虽然人形机器人已经研发多年,但大多数都专注于物理交互,例如模仿人类运动。早期版本的机器人通常是预编程的,或通过软件执行特定任务,例如在控制环境中对物品进行分类。
最近,语言和体感学习模型的进步使新一代机器人能够理解并响应自然语言指令。Mentee Robotics的独特之处在于在Menteebot的整个功能框架中全面整合AI,而非对现有设计进行改造。
Menteebot的三个运作层级
Menteebot利用AI在三个主要层面上将人类指令转换为复杂的行动:
1. 指令理解:通过基于变压器的LLMs,Menteebot理解指令并策划完成任务所需的步骤。
2. 环境映射:利用NeRF算法,它创建一个认知的三维环境地图,收集有关对象的语义信息,并动态定位以规避障碍物。
3. 任务执行:采用模拟到现实(Sim2Real)机器学习方法,Menteebot能够以真实的步态和手部动作执行其计划,这些动作来自于模拟环境的适配。
Amnon Shashua表示:“我们正站在计算机视觉、自然语言理解与先进模拟器交汇的边缘。Mentee Robotics致力于设计一款能够完成家庭任务并通过模仿学习的通用双足机器人。”
尽管演示视频中,Menteebot需要多个指令才能在厨房中移动水果,但作为原型产品,未来的持续改进将使其能够更流畅地处理复杂指令。
Mentee预计最终量产模型将配备仅用摄像头感知的功能、提升灵活性的专有电动机,并完全整合AI,预计将在2025年第一季度发布。不过,目标市场仍未最终确认。
AI驱动人形机器人的竞争
尽管Mentee Robotics受益于Shashua在计算机视觉和LLMs方面的专业知识,但其面临激烈的竞争。特斯拉、OpenAI支持的Figure AI以及1X Technologies等公司正在积极开发AI驱动的人形机器人。同时,英伟达也推出了Project GR00T,这是人形机器人的基础模型,并与Agility Robotics、Boston Dynamics和Unitree Robotics等多家行业参与者合作。
Boston Dynamics最近发布了全电动Atlas人形机器人,目标应用于汽车和工业领域。在这一快速发展的领域,Mentee Robotics需要努力将其AI优先的人形机器人推向市场,竞争将变得更加激烈。