今日は、Mentee Roboticsがステルスモードから抜け出し、AI駆動のヒューマノイドロボット「Menteebot」を発表しました。このスタートアップは、MobileyeやAI21 Labsの創設者であるアムノン・シャシュアが共同設立した企業です。
Menteebotの概要
ただいまプロトタイプ段階のMenteebotは、家庭や倉庫での利用を目的としており、OpenAIのChatGPTによって普及したトランスフォーマー技術に基づく大規模言語モデル(LLM)などの先進AI技術を活用しています。このアプローチにより、ロボットはすべての機能レイヤーで効果的に作動します。
次世代AIエージェント
Menteebotは、複雑なタスクを最初から最後まで遂行できるAIファーストのロボットとして位置づけられています。多くの競合が既存システムにAIを統合しているのに対し、Mentee RoboticsはAI中心の設計哲学に基づいてMenteebotをゼロから開発しました。
会社はMenteebotが音声命令に応答する様子を示す動画を公開し、移動能力、シーン理解、物体検出、把持能力を持ちながら、タスクを処理する様子を披露しました。
Menteebotの独自性
ヒューマノイドロボットはこれまでに開発されてきましたが、多くは人間の動きを模倣した物理的な相互作用に焦点を当てています。従来のロボットは通常、特定のタスクを実行するために、事前にプログラムされたり、ソフトウェアを介して操作されたりしていました。
最近の言語理解や体現学習モデルの進展により、新しいタイプのロボットが自然言語の命令に応じられるようになりました。Mentee Roboticsは、既存の設計に後付けするのではなく、Menteebotの全運用フレームワークにAIを統合することで差別化しています。
Menteebotの三つのレベル
Menteebotは、AIを用いて人間の命令を複雑な動作に変換します。以下の三つの主要レベルで機能します:
1. 命令解釈: トランスフォーマー技術に基づくLLMを利用して、命令を理解し、タスクを完了するために必要なステップを設計します。
2. 環境マッピング: NeRFベースのアルゴリズムを介して、周囲の認知3Dマップを作成し、物体に関するセマンティック情報を収集しながら自らの位置を特定してダイナミックに障害物を回避します。
3. タスクの実行: シミュレーターから現実(Sim2Real)の機械学習アプローチを採用し、シミュレーション環境から適応した本物の歩行と手の動きを用いて計画を実行します。
アムノン・シャシュアは、「我々は、コンピュータビジョン、自然言語理解、および高度なシミュレーターの融合の最前線にいます。Mentee Roboticsにおいて、これは家庭用タスクをこなす一般目的の二足歩行ロボットの設計基盤になります」と述べています。
デモ動画では、Menteebotが台所で果物を一つの場所から別の場所へ移動させる様子が示されていますが、タスクを一連の流れるような動作で実行するのではなく、複数の命令を必要としています。プロトタイプとして、継続的な改善が期待され、最終的にはMenteebotが複雑な命令をシームレスに処理できるようになるでしょう。
市場投入の計画
Mentee Roboticsは、最終的な製品モデルにはカメラのみでのセンサー機能、プロプライエタリな電気モーターによる高い器用性、完全統合されたAIを備え、2025年第一四半期に発売を予定していますが、ターゲット市場セグメントについては未確認です。
AI駆動ヒューマノイドの競争
Mentee Roboticsは、シャシュアのコンピュータビジョンやLLMに関する専門知識の恩恵を受けていますが、テスラ、OpenAI支援のFigure AI、1X Technologiesなど、積極的にAI搭載のヒューマノイドを開発している競合と厳しい競争が待ち受けています。また、Nvidiaはヒューマノイドロボットの基盤モデルであるプロジェクトGR00Tを発表し、Agility Robotics、Boston Dynamics、Unitree Roboticsなど、さまざまな業界のプレイヤーとパートナーシップを組んでいます。
Boston Dynamicsは最近、オートモーティブおよび工業用途向けの全電動ヒューマノイドロボットAtlasを発表しました。競争の激しいこの分野で、Mentee RoboticsがAIファーストのヒューマノイドを展開していく様子が期待されます。