MITのエア・ガーディアン:AIを活用したフライト安全の向上
MITの科学者たちは、パイロットと協力してフライト安全性を大幅に向上させる最先端の深層学習システム「エア・ガーディアン」を開発しました。この人工知能(AI)コパイロットは、人間のパイロットが見逃す可能性のある重要な状況を検出し、潜在的な事故を回避するために介入することができます。
エア・ガーディアンの中心にあるのは、MITのコンピュータ科学と人工知能ラボ(CSAIL)によって開発された革新的な深層学習アーキテクチャ「リキッドニューラルネットワーク(LNN)」です。LNNは、効率的で理解しやすいAIシステムが求められるさまざまな領域で有望な成果を示しており、従来の深層学習モデルに対する魅力的な代替手段です。
人間の注意とAIのフォーカスの同時モニタリング
エア・ガーディアンは、安全性を向上させるための革新的な方法を取り入れています。パイロットの注意とAIのフォーカスを継続的に監視し、両者の注意がズレた場合に検出します。もしパイロットが重要な要素を見逃した場合、AIシステムは関連するフライトパラメータをスムーズにコントロールします。
この「人間とAIの共存」アプローチにより、パイロットは指揮を保ちながら、AIが見落としを補完します。MIT CSAILのAI科学者であり、エア・ガーディアンの研究の共同著者であるラミン・ハサニ氏は、「目指すべきは、人間と協力するシステムを創造し、AIが挑戦的な状況で人間の強みを活かせるようにすることです」と説明しています。
例えば、低高度飛行では予測できない重力の変化がパイロットの方向感覚を失わせることがありますが、エア・ガーディアンはそのようなシナリオで制御を引き継ぐ設計になっています。同様に、過度な画面情報に圧倒された際には、AIがデータをフィルタリングして重要な手がかりを強調します。
高度なモニタリング技術
エア・ガーディアンは、視線追跡技術を使って人間の注意を評価し、ヒートマップでAIのフォーカスを可視化します。ズレが検出されると、エア・ガーディアンはAIが即時対応を必要とする問題を特定したかを分析します。
安全に関わるアプリケーションのAI
エア・ガーディアンは、環境を観察しその観察に基づいて行動を取る深層強化学習モデルに基づいて構築されています。このエージェントは正しい行動に対して報酬を受けることで、効果的な意思決定ポリシーを発展させます。
エア・ガーディアンの特徴は、コアにあるLNNです。LNNは透明性が高く、エンジニアがモデルの意思決定プロセスを詳しく調査することができ、従来の「ブラックボックス」とされる深層学習システムとは顕著に異なります。「安全が重要なアプリケーションにおいては、システムの機能を理解することが不可欠であり、説明性が必須です」とハサニ氏は述べました。
ハサニ氏は2020年からLNNの研究を行い、彼らの効率的なドローン制御システムに関する以前の研究は「Science Robotics」にも掲載されました。現在、彼らはこれらの技術を実世界のアプリケーションに進展させています。
LNNのもう一つの重要な利点は、データから因果関係を学べることです。従来のニューラルネットワークは誤った相関関係を導きがちですが、LNNはデータと相互作用し、反事実的シナリオを探求し、因果関係を理解することでその堅牢性を向上させます。「タスクの真の目的を把握するには、単なる統計的特徴を超えて学ぶことが必要であり、因果関係の理解が重要です」とハサニ氏は指摘します。
コンパクトで効率的なAIソリューション
リキッドニューラルネットワークは、そのコンパクトさでも優れています。従来の深層学習ネットワークとは異なり、LNNは少ない計算ユニットで複雑なタスクを達成できます。この効率性により、処理能力が限られたデバイスでも機能します。「AIシステムが規模を拡大するにつれ、パワーを得てもエッジデバイス上での展開はますます困難になります」とハサニ氏は説明します。
以前の研究では、MIT CSAILチームがたった19ニューロンのLNNが、従来の深層ニューラルネットワークで通常100,000ニューロンを必要とするタスクを学習できることを示しました。このことは、自動運転車やドローン、航空など、リアルタイムの意思決定が重要なエッジコンピューティングアプリケーションにおけるコンパクトさの重要性を強調しています。
エア・ガーディアンとLNNの可能性を広げる
ハサニ氏は、エア・ガーディアンの開発から得られる洞察が、人間との協力を支援するさまざまなシナリオに応用できると考えています。これらのアプリケーションは、特定のソフトウェア内のタスク調整から、より複雑な分野の自動手術や自律運転にまで広がります。「アプリケーションはさまざまな分野で一般化できます」とハサニ氏は強調します。
LNNは、大規模言語モデルの文脈において特に自律エージェントの台頭を促進する可能性があります。AIエージェントが情報に基づいた意思決定を行い、その決定を人間に説明できる能力が求められ、目標を調整することが可能になります。「リキッドニューラルネットワークは普遍的な信号処理システムとして機能します」とハサニ氏は説明します。「入力がビデオ、音声、テキスト、または時系列データであっても、LNNは多様なモデルを生成し、予測モデリング、自律性、生成的AIアプリケーションの新しい道を開きます。」
ハサニ氏は、LNNの現在の進展を、2016年の画期的な「トランスフォーマー」論文のリリース直前の重要な瞬間に例えています。この論文は、ChatGPTなどの大規模言語モデルの基盤を築きました。私たちは今、LNNの本来の可能性を解き放つ寸前にあり、スマートフォンやパーソナルコンピュータのエッジデバイスでの高度なAIシステムに道を開いています。
「これは新たなAIシステムの基盤となるモデルです。革新の新時代が目前に迫っています」とハサニ氏は力強く語ります。