企業向けアプリケーションにおいて、トレーニングデータを超えた知識を大規模言語モデル(LLM)に統合することは非常に重要です。ドメイン特化型の知識や顧客の知見をLLMに組み込む主要な方法として、「リトリーバル拡張生成(RAG)」が挙げられます。しかし、基本的なRAG手法には限界が見られます。
データを強化したLLMアプリケーションを効果的に構築するには、いくつかの要因を慎重に考慮する必要があります。最近のMicrosoftの研究者による調査では、必要な外部データの種類と推論の複雑さに基づいて、さまざまなタイプのRAGタスクを分類するためのフレームワークが提案されています。
“データ強化型LLMアプリケーションは、一律の解決策ではありません。” と研究者は言います。 “特に専門的なドメインにおける実世界の要求は複雑で、提供されたデータとの関係や必要な推論によって大きく異なる可能性があります。”
この複雑さを乗り越えるために、研究者はユーザーの問い合わせを次の四つのレベルに分類することを提唱しています。
- 明示的事実(Explicit Facts): データから直接述べられた事実の取得を必要とする問い。
- 暗黙的事実(Implicit Facts): 表現されていない情報の推論を必要とし、しばしば基本的な推論を含む問い。
- 解釈可能な理由(Interpretable Rationales): 外部リソースからの明示的なドメイン特化のルールを理解し、適用する必要がある問い。
- 隠れた理由(Hidden Rationales): データに明示されていない暗黙の推論手法を明らかにすることが必要な問い。
各問い合わせレベルは独自の課題を持ち、それに応じたソリューションが求められます。
データ強化LLMアプリケーションのカテゴリー
明示的事実の問い合わせ
これらの問い合わせは、データに明示的に記載された事実情報を直接取得することに焦点を当てます。このカテゴリーの定義的特徴は、特定の外部データに直接依存していることです。ここでは、基本的なRAGが一般的に使用されますが、RAGパイプラインの各段階で課題が発生します。たとえば、インデックス作成時には、大規模で未整形なデータセットの管理が求められます。マルチモーダル要素を含む場合も多く、そのためのマルチモーダル文書解析や埋め込みモデルがセマンティックコンテキストを共有空間にマッピングします。
情報取得段階では、取得されたデータの関連性が重要です。開発者は、合成回答を利用して文書ストアとクエリを整合させ、取得精度を向上させることができます。また、回答生成段階では、LLMが関連情報を識別し、知識ベースからノイズを無視できるようにファインチューニングが行われます。
暗黙的事実の問い合わせ
これらの問い合わせは、単なる情報取得を超えた推論を要求します。たとえば、「会社Xは先季度に何個の製品を販売しましたか?」や「会社Xと会社Yの戦略にはどのような主な違いがありますか?」といった質問が該当します。この場合、複数のソースからのデータを使ってマルチホップの質問応答を行う必要があります。
暗黙的事実の問い合わせの複雑性には、インタリーブ型リトリーバルとチェーンオブソート(IRCoT)やリトリーバル拡張思考(RAT)など、先進的なRAG手法が求められます。知識グラフとLLMを組み合わせることで、異なる概念を効果的に関連付けて複雑な推論を行う構造的な方法が提供されます。
解釈可能な理由の問い合わせ
これらの問い合わせは、LLMが事実情報とともにドメイン特有のルールを適用することを要求します。研究者は「解釈可能な理由の問い合わせは、合理的な根拠のために外部データに依存するシンプルなカテゴリです」と説明します。このタイプは、特定の問題に関連する明確なガイドラインや思考プロセスを含むことが一般的です。
たとえば、カスタマーサービスのチャットボットは、リターン処理のための文書化されたプロトコルと顧客のコンテキストを統合する必要があります。これらの合理的な根拠をLLMに統合するのは難しく、強化学習や最適化されたプロンプト評価などのプロンプトチューニング技術が求められます。
隠れた理由の問い合わせ
これらが最も大きな課題を呈します。データに埋め込まれているが明示的に述べられていない推論手法を含むためです。たとえば、モデルが歴史的データを分析し、現在の問題に適用できるパターンを抽出する必要があるかもしれません。
“隠れた理由の問い合わせをナビゲートすることは、さまざまなデータソースに埋め込まれた潜在的な知恵を解読し、活用するために高度な分析手法を必要とします。”と研究者は観察します。
これらの問い合わせに対する効果的なソリューションは、LLMに適切な情報を選択的に抽出するためのインコンテキスト学習を含むことができます。ドメイン特化のファインチューニングも重要であり、モデルが複雑な推論を行い、必要な外部データを特定できるようにします。
LLMアプリケーション構築への影響
Microsoftの研究調査とフレームワークは、外部データを活用したLLMの進化を示し、同時に大きな課題を浮き彫りにしています。企業は、このフレームワークを活用して、LLMに外部知識を統合するための情報に基づいた意思決定を行うことができます。
RAG技術は基本的なLLMの多くの制限に対処しますが、開発者は選択した手法の能力と制約を意識し、必要に応じてより高度なシステムへとアップグレードすることが求められます。