2024年のVB Transformで、IBMのデビッド・コックスが企業における生成AIにおけるオープンイノベーションの重要性を強調しました。コックスは、同社が長年にわたってオープンソース技術に注力してきたことを踏まえ、技術業界に挑戦を与え、インスピレーションを与えるビジョンを示しました。
「オープンイノベーションは人類の進歩の物語です」とコックスは述べ、テクノロジーの進展においてこの概念が必要不可欠であることを強調しました。特にAI開発の現状について、「どこに投資し、ロックインを避けるかの決定を下す必要があります」と述べました。
コックスはAIのオープン性について、単純な二元論に疑問を呈し、「オープンは一つの概念ではありません。それは多くの意味を含んでいます」と説明しました。彼は、テックジャイアン、大学、政府などから生まれるオープンなモデルの新たなエコシステムに言及しました。
しかし、彼は多くの大規模言語モデル(LLMs)におけるオープン性の質について懸念を抱いています。「いくつかのケースでは、ただの数値の塊が提示され、それがどう生成されたかを理解できません」と警告しました。この透明性の欠如は再現性を困難にし、重要なオープンソースの原則を損なうと主張しました。
コックスは、伝統的なオープンソースソフトウェアの成功の特徴を指摘し、頻繁なアップデート、構造化されたリリースサイクル、セキュリティパッチ、活発なコミュニティの貢献がその成功に寄与していると述べました。「すべてが明確に定義されており、企業と広範なコミュニティからの段階的な貢献が可能です」と彼は言いました。
彼は現在のオープンLLMsの状態を批判し、「印象的であるにもかかわらず、核心的なオープンソースの属性が欠けていることが多い」と述べました。一部のプロバイダーはリリーススケジュールが不一致であり、モデルは初回の発表後は更新がないことさえあると指摘しました。この不一致が、真のオープンソースの本質を損なわせ、AIにおけるコミュニティ主導のイノベーションを制限すると述べました。
コックスはIBMの透明性へのコミットメントを強調し、自社のグラニットSiriーズのオープンソースAIモデルについて、「モデルに関するすべてを公開しています」と述べ、品質と不適切なコンテンツのフィルタリングを確保するためにすべての処理コードをオープンソース化したことを明らかにしました。
彼は、このレベルのオープン性が性能を損ないませんと主張し、グラニットのモデルが最先端であることを示すベンチマークを提示し、「優れた性能のために透明性を犠牲にする必要はありません」と述べました。
LLMsについての新たな視点を提供し、彼はそれらを単なる会話ツールではなくデータの表現と位置づけました。LLMsが近い将来、ほぼすべての公開データを包含するとの見積もりを示し、コックスは企業の独自知識がこれらのモデルに大きく反映されていないという重大なギャップを指摘しました。
この問題を解決するために、彼は企業データを基盤モデルに組み込むミッションを提唱しました。リトリーバル拡張生成(RAG)などの手法が存在しますが、彼はそれらが独自の企業知識やプロプライエタリ情報を活用できていないことが多いと述べました。
コックスは企業向けに、信頼できるオープンベースモデルを特定し、ビジネスデータの新たな表現を作成し、それを展開・スケールして価値を創造するという三段階のアプローチを示しました。特に規制の厳しい業界においては、基盤モデルの選定で透明性が必要であると強調し、多くのモデルプロバイダーがデータを開示していない点に注目しました。
課題は、プロプライエタリデータと基盤モデルを効果的に統合することにあります。コックスは、選ばれた基盤モデルが高パフォーマンスで透明性があり、オープンソースである必要があると述べ、企業に必要なコントロールと柔軟性を提供することを強調しました。
彼のビジョンを実現するために、コックスはIBMとRed Hatの共同イニシアチブであるInstructLabを紹介しました。このプロジェクトは、企業知識をAIモデルに統合することを目的としています。「InstructLabはLLMsに対する本物のオープンソース貢献を可能にします」と彼は説明しました。
プロジェクトは、世界の知識とスキルの構造化タクソノミーを用いており、ユーザーがモデル性能を的確に向上させることができます。この構造的アプローチは、エンタープライズ固有のインサイトを統合するための障壁を低くし、ドメイン専門家がモデルをカスタマイズするのを容易にします。
InstructLabは「教師」モデルを活用して合成トレーニングデータを生成し、プロプライエタリデータを基盤モデルにシームレスに統合しながらも性能を損なうことはありません。特に、このプロジェクトはモデル更新サイクルをわずか1日に短縮し、従来の長いリリースサイクルと対比させることでその特長を際立たせています。
コックスの洞察とIBMのInstructLabは、企業AIの採用におけるシフトを示唆しています。汎用モデルから各企業の独自の専門知識を反映したカスタマイズされたソリューションへの移行が進んでいるのです。技術が進化する中で、競争優位性は、企業の知識をAI駆動のインサイトに変える能力に依存する可能性があります。AIの次の章は、単に賢い機械を創造することではなく、ユーザーと同じくらいビジネスを理解した機械を生み出すことです。