大規模言語モデル(LLM)は、さまざまな解決策を検討することで、計画や推論のタスクにおいて潜在能力を示しています。しかし、現在の手法は遅く、計算リソースを多く消費し、時には信頼性のない結果を生むことがあります。
この課題を克服するために、コーネル大学とIBMリサーチの研究者たちは、LLMの計画能力をルールベースの探索アルゴリズムの効率성과精度と組み合わせたAutoToSという技術を開発しました。AutoToSは、人間の介入を最小限に抑え、計画問題の解決に伴う計算コストを大幅に削減することで、広範な解決空間での理論的な意思決定を必要とするLLMアプリケーション向けの実用的なソリューションとなります。
計画のための革新的技術
LLMを計画問題に活用しようとする関心が高まったことで、さまざまな手法が生まれました。その中でも特に効果的なのが「Tree of Thoughts」で、LLMを探索アルゴリズムとして利用し、解決策の妥当性を確認し、修正を提案します。しかし、これらの技術には、LLMの呼び出しが多く、コストがかかることと、「完全性」と「健全性」の保証がないという2つの重要な課題があります。完全性は解決策が存在する場合に必ず見つかることを保証し、健全性は提供される解決策が有効であることを確認します。
「Thought of Search(ToS)」は、LLMを活用して探索アルゴリズムの重要なコンポーネントである後継関数(異なるノードを探索)や目標関数(目的の状態に達したかを判断)を生成する代替手法を提案しています。この方法により、探索プロセス全体でのLLMの関与を減らし、効率を向上させることが可能になります。
IBMリサーチの主任研究員であるマイケル・カッツは、「従来、計画コミュニティは新しい問題に対して手動でこれらのコンポーネントをコーディングするか、手動でコーディングされたまたはデータから学習された計画言語の記述から生成していました。私たちは、大規模言語モデルを用いてテキストの問題記述から探索コンポーネントのコードを生成することを目指しました」と説明しています。
AutoToSによるプロセスの自動化
この制約に対処するために、AutoToSはユニットテストやデバッグ文を活用してフィードバックとデバッグプロセスを自動化します。また、few-shotおよびchain-of-thought(CoT)プロンプティング技術を使用します。
AutoToSは複数のステップで動作します。まず、問題の説明をLLMに供給し、後継関数と目標関数のコードを生成させます。次に、ユニットテストを用いて目標関数を評価し、必要な修正のフィードバックを提供します。目標関数がテストに合格すると、アルゴリズムは限られた幅優先探索を実施し、健全性と完全性を検証し、関数がすべての基準を満たすまで繰り返します。最終的に、検証された関数を従来の探索アルゴリズムに統合し、効率的に完全な探索を実行します。
AutoToSの評価
研究者たちは、AutoToSをBlocksWorld、Mini Crossword、24 Game(4つの整数を算術計算で合計24にする)など、さまざまな計画および推論タスクで評価しました。彼らは、GPT-4o、Llama 2、DeepSeek Coderなどの異なるLLMを利用し、モデルのサイズによる性能のばらつきを分析しました。
その結果、AutoToSによりすべてのモデルがフィードバックを使ってコードエラーを特定し修正できることが示されました。大きなモデルは一般に、フィードバックなしで正確な目標関数を生成し、後継関数を改善するために最小限の反復が必要でした。特に、GPT-4o-miniはその小さいサイズにもかかわらず高い正確度を示しました。
研究者たちは「わずか数回のLLM呼び出しで、直接的な人間のフィードバックなしに探索コンポーネントを取得できることを示します。これにより、健全性、完全性及び軸不変性をほぼ100%保証します」と述べています。AutoToSは、他のアプローチと比較してLLMの呼び出し数を大幅に削減しました。例えば、24 Gameデータセットの1,362のパズルを解くためには、従来の方法で約100,000回のGPT-4呼び出しが必要でしたが、AutoToSでは平均2.2回の呼び出しで済みました。
カッツは「これらのコンポーネントを使用すれば、標準的な幅優先探索アルゴリズムを用いて、全1,362ゲームを2秒未満で完全に正確に解決できます。これは従来の方法では達成できなかったことです」と述べています。
企業アプリケーションへの影響
AutoToSは、計画ソリューションを必要とする企業環境にとって大きな潜在能力を持っています。LLMの使用コストと手動入力への依存を減らすことで、専門家は高レベルの計画や目標仕様に集中できるようになります。
カッツは「私たちはAutoToSが、検証可能な探索コンポーネントを作成し、開発を加速しながら、LLM展開に特有の課題を回避することで、計画ベースのソリューションの開発と展開を両方とも向上させることを期待しています」と強調しました。
ToSとAutoToSは、深層学習とルールベースのシステムを融合させたハイブリッドアプローチである神経シンボリックAIの好例です。このアプローチは、現在のAIシステムの欠点に対処する効果的な方向性としてますます認識されています。
IBMの研究科学者であるハルシャ・コケルは「ハイブリッドシステムがAIにおいて果たす役割の未来に疑いの余地はありません。現在の言語モデルは、次のトークンを決定するための探索を行っているため、ハイブリッドシステムと見なすことができます」と述べました。
ToSとAutoToSは大きな期待を寄せられていますが、さらなる探求が必要です。「自然言語による計画がどのように進化するか、LLMが意思決定プロセスにおける計画ツールの統合をどのように強化できるかを見るのは刺激的です。これは将来の知的エージェントの道を切り開くものです」とコケルとカッツは結論づけました。「私たちは、LLMの世界知識が現実世界の状況における計画と行動をどのように豊かにできるかを探求したいと考えています。」