カリフォルニア大学バークレー校の研究チームは、ヒューマノイドロボットがさまざまな地形や障害物を巧みにナビゲートできる革新的な制御システムを開発しました。このAI駆動のシステムは、大規模言語モデル(LLM)を変革した深層学習の枠組みにインスパイアされています。基本的な原理はシンプルで、最近の観察を分析することで、AIは未来の状況や行動を予測することができます。
完全にシミュレーションでトレーニングされたこのシステムは、不測の現実世界の条件においても高いパフォーマンスを発揮します。過去の相互作用を評価することで、訓練中に遭遇しなかった新しいシナリオに柔軟に対応できるように行動を動的に調整します。
あらゆる地形に対応するロボット
ヒューマノイドロボットは、人間に似たデザインのため、さまざまな身体的および認知的タスクを遂行する貴重なアシスタントになる可能性があります。しかし、柔軟な制御システムの開発は困難であり、特に多様な環境に対応できるロボットを作るには多くの挑戦が伴います。
従来のロボティクスの制御システムは特定の作業に特化しているため、現実世界の不確実な地形や視覚条件に対処するのが難しいという問題があります。この硬直性により、制御可能な環境にしか適用できません。そのため、ロボット制御の学習ベースの手法に対する関心が高まっています。こうしたシステムは、シミュレーションや直接的な環境との相互作用から得たデータに基づいて行動を調整できます。
バークレー校の制御システムは、ヒューマノイドロボットをさまざまなシナリオで巧みに導くことを約束します。一般的なヒューマノイドロボット「Digit」に搭載されたこのシステムは、歩道やトラック、広場などの日常的な人間環境を安定して歩行できる特別な能力を発揮します。ロボットは、コンクリート、ラバー、芝生などさまざまな地面を落ちることなく巧みに移動します。
研究者たちは、「私たちのコントローラーはすべてのテストされた地形を信頼性高く歩行でき、安全ゲートなしでの運用に問題がないことを確認しました。一週間の屋外テスト中に落下は観察されませんでした」と報告しています。
さらに、ロボットは外的な妨害に対する耐性を厳格にテストされています。予期しない段差や進行方向にあるランダムな障害物、さらには飛来物にも効果的に対処し、押されたり引かれたりしても安定を維持します。
トランスフォーマーによるロボット制御
さまざまなヒューマノイドロボットが印象的な能力を示す中、この新システムはそのトレーニングと展開方法論で際立っています。AI制御モデルは、Isaac Gymという高性能な物理シミュレーション環境を基に、シミュレーション専用で訓練されました。数千のドメインと数百億のシナリオに基づいており、この広範なシミュレーション経験は、追加のファインチューニングなしで現実世界にスムーズに適用できます。このプロセスは「シムからリアルへの転送」と呼ばれ、特にトレーニング中に明示的に扱われなかった段差をナビゲートするなど、現実のシナリオでの新たな能力を示しています。
このシステムの核心は「因果トランスフォーマー」と呼ばれる深層学習モデルで、過去の proprioceptive 観察と行動を処理します。このトランスフォーマーは、特定の情報、例えば歩行パターンや接触状態の重要性を効果的に識別します。トランスフォーマーは大規模な言語モデルにおいての成功が知られており、広範なデータシーケンス内の次の要素を予測する力に優れています。ロボットに用いられる因果トランスフォーマーは、観察と行動のシーケンスから学習し、その行動の結果を予測することで、知らない地形でも動的に適応できます。
研究者たちは、「観察と行動の履歴が、強力なトランスフォーマーモデルがテスト時に動的に行動を適応させるために使用できる世界に関する情報を暗黙的に符号化していると仮定します。」と述べています。この概念は「文脈適応」と呼ばれ、言語モデルが文脈情報を利用して新しいタスクを学び、推論中に出力を洗練する方法と類似しています。
トランスフォーマーは、時間的畳み込みネットワーク(TCN)や長短期記憶ネットワーク(LSTM)などの他の逐次モデルに対して優れていることが証明されています。そのアーキテクチャは、追加のデータや計算リソースによるスケーラビリティをサポートし、さまざまな入力モダリティを統合することで強化されます。
過去1年で、トランスフォーマーはロボティクスコミュニティ内で貴重なツールとして台頭し、複数のモデルがその汎用性を活用してロボットの能力を向上させています。トランスフォーマーは、異なるモダリティのエンコーディングの向上や、高レベルな自然言語指示をロボットの具体的な計画ステップに変換する際に大きな利点を提供します。
研究者たちは結論として、「視覚や言語の分野と同様に、トランスフォーマーは現実世界のヒューマノイドの歩行における学習アプローチのスケーリングに向けた進展を促進する可能性があると考えています。」と述べています。