過去の技術革命と同様に、多くの組織が商業用の大規模言語モデル(LLM)を導入するか、オープンソースの代替品を利用するかで議論しています。この選択は、目標によって異なります。適切なモデルを選び、高品質な企業データで強化することは、非常に重要な決定です。ここでは、クローズドソース、オープンソース、ハイブリッドの各モデル構造について概観します。
モデルの種類:クローズドソースとオープンソース
生成AIアプリケーションを構築する際、組織は通常、クローズドソースとオープンソースのLLMのいずれかを選択します。クローズドソースのLLMは、セキュリティや知的財産保護の観点から、ソースコードを非公開のまま維持します。一方、オープンソースのLLMは、ソースコードを無料で提供し、ユーザーがソフトウェアを修正・適応できるようにしています。ただし、一部のオープンソースモデルには商業ライセンスを必要とする制限があり、これを「オープンモデル」と呼ぶことがあります。この場合、アーキテクチャやパラメータは一般に公開されている一方で、特定のコードは独自資産として残ります。こうした協働作業は、バイアスの特定や知識共有を促進するのに役立ちます。
データ:その重要性
ライセンスや利用条件は、特定のモデルをどう活用するかに大きな影響を与えます。しかし、クローズとオープンの議論に執着するのは短視眼的です。PwCの調査によれば、70%のCEOが、今後3年間で生成AIが自社の運営を変革すると予測しています。したがって、データの質に焦点を当てることが、競争上の重要な差別化要因となります。
データの理解を刷新する時です。「新しい石油」と呼ばれることもありますが、実際には水に近いと言えます。水が生命を支えるように、データは生成AIを活性化します。どちらも、効果的であるためには慎重な調達とクリーニングが求められます。
生成AIの可能性を最大限に引き出すには、高品質なデータを厳密なプロセスに通す必要があります。これには、データの収集、クリーニング、前処理、ラベリング、整理を行った後、モデルのトレーニング、評価、チューニングに進むことが含まれます。
モデルの最適化
異なるモデルのタイプやサイズを試すことは、具体的なニーズに応じて重要です。最適化は、ビジネスに最も適したモデルを選ぶことで効果を大きく向上させることができます。
膨大なデータを含む包括的なモデル、例えば広範な知識を持つデジタルアシスタントが必要ですか?それならば、数百億のデータポイントを備えた大規模LLMが理想的でしょう。
逆に、顧客向けの特定の製品情報を提供することが目標であれば、RAG(情報検索強化生成)を利用した小規模言語モデル(SLM)が十分かもしれません。モバイルアプリケーションの場合、スマートフォン向けに設計されたコンパクトなLLMが、高速でコスト効率が良く、エネルギー効率に優れたソリューションを提供する場合があります。
さらに、これらのモデルの展開場所も重要です。企業データを用いてオンプレミスでアプリケーションを構築することで、より良い統合が可能になります。
結論
生成AIモデルの世界は常に進化しており、将来のモデルは現在のものとは大きく異なるでしょう。どの道を選んでも、適切な組織と提携することで、データを実行可能な洞察に変えることができます。
Dell Technologiesは、AI最適化された技術の包括的なスイートを提供し、あなたのデータに必要なサポートを確保します。Dellの検証済みリファレンスデザインにより、生成AIサービスを開発するための基盤となる設計図を手に入れ、専門のサービスチームがサポートします。