メディアとテクノロジーの専門家たちは、オープンソースの大規模言語モデル(LLM)が企業内の生成AIに大きな影響を与える可能性があると指摘しています。この影響は、OpenAIのChatGPTやAnthropicのプロプライエタリモデルよりも大きいかもしれません。
オープンソースモデルの実験や実証プロジェクトは数多く行われているものの、既存企業は現実世界での応用については慎重な姿勢を見せています。そこで、Meta、Mistral AI、IBM、Hugging Face、Dell、Databricks、AWS、Microsoftなどの主要なオープンソースLLMプロバイダーに問い合わせを行いました。この調査からは、注目すべき16の導入例が明らかになりました(以下のリスト参照)。この数は少ないものの、業界アナリストは年末までにオープンソースアプリケーションが急増すると予測しています。
オープンソースLLM採用の遅れ
オープンソースモデルの普及が遅れている一因は、その登場が最近であることです。Metaは2023年2月に、OpenAIが2022年11月にChatGPTをリリースしてから3ヶ月後に最初の本格的なオープンソースモデル「Llama」を発表しました。また、Mistral AIの「Mixtral」は、評価の高い最新モデルですが、リリースからまだ1ヶ月しか経っていません。このため、実世界での導入がようやく始まったところです。オープンソースの支持者は、現在はクローズドモデルの方が普及しているものの、今後そのギャップは縮まると考えています。
オープンソースモデルの課題
現在のオープンソースモデルには限界があります。ソフトウェアスタートアップReplitのCEO、アムジャド・マサドは、モデル開発に必要なフィードバックメカニズムが不十分で、改善への貢献が難しいと指摘しています。しかし、多くのオープンソース開発者が行っている実験の広がりを過小評価しているかもしれません。彼らは何千もの派生モデルを生み出しており、特定のタスクにおいてはいくつかのモデルがクローズドモデルに匹敵するか、あるいはそれを上回る性能を示しています(例:FinGPTやBioBert)。
企業にとっての大規模公開モデルの限界
DellのAI戦略担当SVP、マット・ベイカーは「大規模公開モデルはプライベート企業にほとんど価値がありません」と述べています。これらのモデルは一般化されすぎており、約95%の企業が行うAI作業であるプライベートデータの統合が容易ではないためです。そのため、多くの企業はカスタムコードを使用してオープンソースの顧客支援やコード生成のソリューションを検討していますが、これらのコードは一般的なクローズドモデルのLLMとは互換性がないことが多いです。
企業の考慮による動きの鈍さ
Hugging Faceのアンドリュー・ジャーディンは、企業がLLMアプリケーションを導入するのをためらう理由として、データプライバシー、顧客体験、倫理的影響を重視することを挙げています。企業は典型的には内部利用のケースをパイロット試験し、その後、外部アプリケーションに展開する傾向があります。クローズドモデルが2023年末に大規模に導入された一方で、オープンソースの実装は今年中に加速すると予測されています。とはいえ、一部の企業はオープンソースの取扱いが煩雑だと感じており、OpenAIのような提供者の確立されたAPIを取り扱う方が簡潔だと見なすことも少なくありません。
オープンモデルとクローズドモデルのギャップを埋める
ジャーディンは、オープンモデルとクローズドモデルの境界がますます曖昧になっていると強調しています。たとえば、大手製薬会社を含む多くの企業では、内部タスクにはクローズドLLMを使用し、特定の機能においてはオープンソースモデルを利用しています。これはデータ制御の強化を反映した選択です。
オープンソース採用の理由
モデルの適応とコスト要因が急速に変化する中、企業はリスクを軽減するためにオープンソースとクローズドモデルを柔軟に切り替えられることを求めるでしょう。企業はしばしば、機密データを保持しながら、特定の用途に合わせてオープンソースモデルを微調整することを選択します。
IntuitやPerplexityなどのいくつかの企業は、オープンソースかクローズドかにかかわらず、特定のタスクに向けてさまざまなモデルの統合を可能にする生成AIオーケストレーション層を開発しています。オープンソースモデルを大規模に展開するにはより多くのリソースが必要な場合もありますが、特に既存のインフラを持つ組織にとっては、コスト削減をもたらす可能性があります。
多くの企業が静かにオープンソースモデルを活用しています。たとえば、自動車メーカーや航空会社は、オープンソースのLLMを取り入れたDatabricksのレイクハウスプラットフォームを使用したアプリケーションの実験を行っています。
オープンソースの導入事例の特定の課題
真正な企業のユースケースを定義することは困難です。多くの開発者やスタートアップがオープンソースLLMを使用したアプリケーションを作成していますが、私たちは著名な企業で顕著な応用をしているケースに焦点を当てました。当社は、エンタープライズを従業員数が100人以上の企業と定義し、LLM技術の提供者ではなく、エンドユーザーに注目しました。
「オープンソース」の定義にも課題があります。MetaのLlamaのように制限のあるライセンスを持つモデルもあります。また、Writerのように独自のLLMを開発している企業もありますが、オープンソースのモデルは限られているため、この分類が複雑になります。
以下は、オープンソースLLMを活用した企業の導入事例の一部です:
1. VMWare: 自社ホスティング環境でHugging FaceのStarCoderモデルを利用し、プロプライエタリコードのセキュリティを確保したコード生成を強化しています。
2. Brave: プライバシー重視のブラウザが、会話型アシスタント「Leo」にMixtral 8x7Bモデルを使用しています。
3. Gab Wireless: Hugging Faceのモデルを利用して、子供の安全のためにメッセージを監視し、不適切なコンテンツをブロックしています。
4. Wells Fargo: MetaのLlama 2モデルをさまざまな内部アプリケーションに活用し、従業員リソースを向上させています。
5. IBM: 社内の人事関連の問い合わせをサポートするAskHRアプリにオープンソースLLMを活用し、新しいコンサルティングサービスにも用いられています。
6. グラミー賞: IBMと協力し、「AI Stories」でLlama 2を使用してファン向けのカスタムインサイトとコンテンツを生成しています。
7-9. マスターズトーナメント、ウィンブルドン、USオープン: IBMの技術を活用し、イベント中のリアルタイムでの解説やハイライト生成を行っています。
10. Perplexity: 検索エンジンでの応答要約にオープンソースLLMを使用するスタートアップです。
11. CyberAgent: 日本語のユーザーニーズに合わせた言語モデルにDellのオープンソースLLMを活用しています。
12. Intuit: 自社のLLMとオープンソースモデルを統合し、Intuit Assist機能の向上を図っています。
13. Walmart: 会話型AIアプリケーションを開発し、最初はGoogleのオープンソースBERTモデルを利用しました。
14. Shopify: Llama 2をSidekickで導入し、eコマース事業者のタスクを効率化するAIツールを提供しています。
15. LyRise: リクルーティング用のチャットボットを開発するタレントマッチングスタートアップで、Llamaを利用してやり取りを行っています。
16. Niantic: モバイルゲーム「Peridot」でキャラクター間のインタラクションを促進するためにLlama 2を使用しています。
これらの導入事例の定義と追跡には課題がありますが、オープンソースLLMへの関心は急増しています。より多くの企業がその可能性を探る中、公共のユースケースの数が増加することが期待されます。新たな情報が得られるたびに、このリストを更新していきます。