データブリックス(Databricks)は急成長を遂げている企業ソフトウェア会社で、DBRXという画期的なオープンソース人工知能(AI)モデルを発表しました。このモデルは、AIの効率性と性能基準を革命的に再定義することを目的としています。
DBRXは1320億のパラメータを持ち、言語理解、プログラミング能力、数学的な熟練度などの重要分野で、Llama 2-70BやMixtralといったトップオープンソースモデルを上回ります。OpenAIのGPT-4には及びませんが、データブリックスの幹部は、DBRXがGPT-3.5よりも効率的でコスト効果に優れた代替手段であると強調しています。
データブリックスのCEOであるアリ・ゴドシ(Ali Ghodsi)は、最近のプレスイベントで次のように述べました。「DBRXを世界に紹介し、オープンソースAIを進展させられることを非常に嬉しく思います。GPT-4のようなモデルは優れた汎用ツールですが、私たちの焦点はクライアントの特有データを深く理解するためのカスタムモデルを作成することにあります。DBRXはこの使命へのコミットメントを示しています。」
DBRXは、言語理解のベンチマークテスト(MMLU)、プログラミング(Human Eval)、数学(GSM 8K)で優れたパフォーマンスを示しています。GPT-4には及ばないものの、一般的に使用されるGPT-3.5に対しては大きな改善を遂げています。
DBRXの大きな特徴は、革新的な「エキスパート混合」アーキテクチャです。競合と違い、DBRXは各単語生成にすべてのパラメータを使用するのではなく、16の専門サブモデルを採用し、各トークンに対して関連する4つのエキスパートのみを活性化させます。この設計により、36億のパラメータを同時に使用してパフォーマンスを最適化し、より速く、コスト効率の高い運用を実現しています。
データブリックスが昨年買収したモザイクチーム(Mosaic team)は、以前のMega-MoEイニシアチブに基づいてこのアプローチを開発しました。ゴドシは「モザイクチームは、基盤となるAIモデルを効率的に訓練する能力を磨いてきました。DBRXは約2ヶ月で、費用は約1000万ドルでした」と述べています。
DBRXをオープンソース化することで、データブリックスは高度なAI研究のリーダーとしての地位を確立し、革新的なアーキテクチャのより広範な採用を促進することを目指しています。このリリースは、クライアント特有のデータセットに合わせたカスタムAIモデルの構築とホスティングに主眼を置いたデータブリックスの方針とも一致しています。
現在、多くのデータブリックスの顧客は、OpenAIのGPT-3.5を依然として使用していますが、機密性の高い企業データに対して第三者のモデルを使用することはセキュリティ上の懸念を引き起こします。ゴドシは、「クライアントは、世界中の規制データを当社に信頼しています。データはすでにデータブリックスにあるため、DBRXはデータのセキュリティを確保しながら高度なAI機能を提供します」と述べています。
DBRXはGPT-4と直接競合するものではありませんが、言語理解、プログラミング、数学のベンチマークテストではGPT-3.5を大幅に上回り、低コストで有望なオープンソースの選択肢として浮上しています。
DBRXの発表は、データとAIプラットフォーム分野での競争が激化する中で行われており、Snowflakeなどの競合他社が類似の機能を導入する一方、主要なクラウドプロバイダーも生成AIの提供を強化しています。
高度なオープンソース研究の分野で存在感を示すことで、データブリックスはAIのリーダーシップを確立し、優れたデータサイエンスの人材を惹きつけることを目指しています。また、このリリースは、大手技術企業が提供する商業的AIモデルに対する懐疑的な見方の高まりを活用するものでもあります。
DBRXの真価は、その採用とデータブリックスの顧客に提供する価値にかかっています。企業がAIを活用しながら、自己のデータへのコントロールを維持することを望む中で、データブリックスは最先端の研究と堅牢な企業プラットフォームを融合させて競合との差別化を図っていると信じています。
DBRXの導入を通じて、データブリックスは主要なテクノロジー企業やオープンソースの競合に対抗し、その先進的な取り組みを認めさせようとしています。競争が激化するAIの領域において、データブリックスは重要なプレイヤーになる準備が整っています。