デルとHugging Faceが提携して大規模言語モデルの導入を簡素化

ほとんどの企業が、ビジネス運営における大規模言語モデル(LLM)や生成AIの利点を探求しています。しかし、クラウドコンピューティングやビッグデータ分析の初期の頃の懸念が今も残っています。企業はどのように実装を開始すればよいのか?機密の知的財産をどのように保護するのか?リソースを多く消費するファインチューニングのプロセスをどのように管理するのか?

デラル(Dell)とハギングフェイス(Hugging Face)は、これらの課題に取り組むために提携し、企業がこの進化する技術の利点を最大化できるよう、カスタマイズされたLLMのオンプレミスデプロイメントを簡素化しています。

デラルのAI戦略担当SVP、マット・ベイカーは、最近のプレスブリーフィングで生成AIの変革的な影響を強調し、「生成AIやAIについて話すことなしには先に進めない」と述べ、技術の複雑さに対する懸念を示しました。

デラルとハギングフェイスの提携

この提携を通じて、デラルとハギングフェイスは、ハギングフェイスプラットフォーム上に専用のポータルを開設します。このポータルでは、デラルのサーバーおよびストレージシステムにオープンソースモデルをデプロイするためのカスタムコンテナ、スクリプト、技術文書を提供します。最初はデラルのPowerEdgeサーバー向けのAPEXコンソールを通じて提供され、将来的にはPrecisionやその他のデラルワークステーションツールにも拡張される予定です。ポータルは、最新の生成AIのユースケースをサポートするための最適化されたモデルコンテナが定期的に更新されます。

ハギングフェイスの製品責任者、ジェフ・ブーディエは、「AIの運命をコントロールするためには、単なるユーザーからビルダーになる必要がある。これはオープンソースによってのみ実現できる」と述べました。

この提携は、AIと分析ワークフローに特化して設計されたObjectScale XF960を含む、生成AIのリーダーとしての地位を確立しようとするデラルの継続的なコミットメントの一環です。ベイカーは、提携に関してユーモラスにコメントし、「デラルとハギングフェイスがプラクティショナーが『抱きしめる』ことを避けようとしているが、まさにその通りである」と述べました。

生成AI導入の課題

ベイカーは、企業が生成AIを採用する際に直面するいくつかの障害を特定しました。これには、複雑さ、価値の実現時間、ベンダーの信頼性、ROI、コスト管理が含まれます。ビッグデータの初期の課題と同様に、企業はプロジェクトを概念実証から本稼働に移行する際に、自社の知的財産を保護することに苦労しています。

「多くの企業は、独自のデータを保護しながら生成AIのトレンドに応えるプレッシャーに圧倒されています」とブーディエは述べ、GitHub Copilotなどの人気ツールのリスクについて指摘しました。デラルの調査によると、83%の企業が知的財産の保護を強化するために、オンプレミスまたはハイブリッドの実装を好んでいることが示されています。ベイカーは、「最も価値のある資産に関しては、オンプレミスでのデプロイが重要です」と指摘しました。

パフォーマンスと精度に最適化されたモデル

デラルとハギングフェイスのポータルでは、パフォーマンス、精度、ユースケースに最適化されたキュレーションモデルを提供します。組織は、希望するモデルとデラル構成を選択し、それを自社のインフラ内で簡単にデプロイできるようになります。

「あなたのプラットフォームに特化してファインチューニングされたLLama 2モデルを想像してみてください。すぐに使用可能です」とベイカーは述べ、マーケティングコンテンツの生成、チャットボット、ソフトウェア開発などの潜在的なアプリケーションを示しました。彼は、ユーザーのために複雑さを排除することを目指しており、ハギングフェイスから必要な機能をデプロイする「イージーボタン」と表現しています。

この取り組みが他の多くのものと異なるのは、デラルの全体的な設定を調整する能力にあります。これにより、公的なモデルとのデータ共有なしに、最適なモデル設定を迅速にデプロイできます。「あなたのデータはあなたのものです」とベイカーは言い、「一度ファインチューニングされたモデルは、あなた自身のものです」と付け加えました。

AIの縦割り化

最適なパフォーマンスのためにモデルをファインチューニングすることは時間を要する場合があります。生成AIを試験的に利用している多くの企業は、標準のLLMとともにリトリーバル強化生成(RAG)を利用しています。この技術は、必要な文脈を提供するために外部の知識ソースを取り入れることで生成タスクを強化します。

ベイカーは、「RAGは、ゼロから新しいモデルを構築することなく、ユーザーが正確な指示を生成できるようにします」と説明しました。ファインチューニングプロセスをさらに合理化するために、デラルはLoRAやQLoRAなどのパラメータ効率的な方法を利用したコンテナ化ツールを導入する予定です。企業が独自の縦割りにますます焦点を当てる中、ベイカーは「すべての企業は、特定のデータを活用する縦割りの存在になる」と述べています。このトレンドは、ドメイン特有のモデルだけでなく、独自のデータをモデルに統合してカスタマイズされた生成結果を得ることを意味しています。

Most people like

Find AI tools in YBX