大規模言語モデル(LLM)は本当に大きい方が良いのか?
Google Cloudのデータ、分析、AIの戦略および製品管理担当バイスプレジデント、ヤスミーン・アハマド氏がVB Transformでこのテーマについて洞察を共有しました。彼女の明確な回答は、「はいといいえ」です。
大規模なLLMは一般的に優れたパフォーマンスを発揮しますが、その性能は無限ではありません。アハマド氏は、特定のドメインに基づいて訓練された小型モデルが、大型モデルを上回ることがあると強調しました。「データが基盤です」と彼女は述べ、業界特化型の情報がモデルに力を与えることを示しました。
このアプローチは、企業内での創造性、効率性、インクルーシブネスを促進します。以前はアクセスできなかったデータを活用することで、組織は従業員を革新的な方法で巻き込むことができます。
「生成AIは機械が創り出せるものの可能性を広げています」とアハマド氏は言います。「それは技術と魔法の境界を曖昧にし、私たちが魔法と考えるものを再定義する可能性があります。」
新たなAIの基盤の必要性
特定の企業文脈でLLMを効果的に訓練するためには、ファインチューニングとリトリーバル拡張生成(RAG)の二つの重要手法が必要です。ファインチューニングはLLMに「あなたのビジネスの言語」を理解させ、RAGはモデルをリアルタイムのデータに接続します。これにより、文書やデータベースなど、さまざまな情報源からの正確な回答が可能になります。
「これにより、財務分析やリスク分析に不可欠な正確な回答が実現します」とアハマド氏は説明します。
LLMの本来の強みはマルチモーダル機能にあります。これにより、動画、テキスト、画像など多様なデータタイプを扱うことができます。企業データの80〜90%がマルチモーダルであるため、アハマド氏はこの情報を効果的に活用するためにLLMを利用する重要性を強調しました。
Googleの研究では、マルチモーダルデータを使用した企業において、顧客体験が20〜30%改善されたことが示されています。これにより、企業は顧客の感情を把握し、市場トレンドに対する製品のパフォーマンスを分析する能力が向上しました。
「もはや単なるパターン認識ではありません」とアハマド氏は述べます。「LLMは、すべての利用可能なデータにアクセスすることで、我々の組織の複雑さを理解できます。」
従来の企業は、マルチモーダル情報を処理することに苦労する古いデータインフラに直面しています。AIの未来には、この複雑性に対応できる新しい基盤が必要です。
対話型AI:インタラクションの役割
アハマド氏は、成功するLLMにおける質問-回答のインタラクションの重要性も強調しました。ビジネスデータとのチャットは魅力的に思えますが、チャンスもあれば課題も存在します。
例えば、コンテキストなしに同僚に次四半期の売上予測を尋ねると、彼らの回答は漠然としたものになるかもしれません。同じことがLLMにも当てはまり、正確な応答を提供するためには、意味的なコンテキストやMetaデータが必要です。
人間の分析では、質問を洗練し、明確さを得るために対話を繰り返すことがよくあります。同様に、LLMも孤立した一度限りのインタラクションから進化し、次世代の対話型AIへと発展する必要があります。
「これを個人データのサイドキックとして考えてみてください」と彼女は提案しました。この疲れを知らない労働者は、思慮深い交流を行い、クエリの透明性を確保して、ユーザーが結果を信頼できるようにします。
アハマド氏は、「エージェントAI」の登場にも言及しました。このシステムは、意思決定を行い目標を追求する能力を備えています。タスクをサブタスクに分解し、戦略的思考能力を発展させることで、人間の思考過程を模倣します。
リアルタイム機能の進展に伴い、これらの開発は前例のない速度で進行しています。「未来はすでにここにあり、新たなビジネスの種を育んでいます」とアハマド氏は締めくくりました。「私たちはこの技術がもたらす可能性の始まりに過ぎません。」