Cassandra:DataStax CEOが語る、生成AIに最適なデータベース

データスタックスのCEO、チェット・カプール氏は、Siriコンバレーで開催されたAI.Dev会議で、オープンソースのApache Cassandraを活用するクラウドデータベース企業が、生成AIに最適なデータベースであると宣言しました。

生成AIエージェントの登場

カプール氏は、リナックス財団イベントの700人の聴衆の前で、生成AI分野でのスタートアップ企業と既存企業の間の競争の激しさに言及しました。企業が技術の選択肢を探る中で、データベースプロバイダーの選定が重要な要素となります。OpenAI、Anthropic、Google(Gemini)、Meta(Llama)などの大規模言語モデル(LLM)提供者は多くの注目を集めていますが、LLMアプリケーションをサポートする企業間のデータベース競争も同様に熾烈です。

カプール氏は基調講演で、データスタックスのCassandraデータベースが際立つ理由をいくつか挙げました。特に、企業に支持される最も信頼性の高い実用データベースの一つであり、多くの組織がCassandraを使って生成AIを大規模に展開しています。その技術的な優位性により、MongoDBやPineconeといった競合を上回る成果を上げています。

データスタックスは上場を検討しており、カプール氏は投資家の関心を引くために積極的です。昨年6月には、16億ドルの評価額で1億1500万ドルを調達しました。具体的な財務情報は公開されていませんが、カプール氏は2024年から2025年にかけて上場を目指す企業にとって注目の存在であると述べています。

カプール氏の主なポイント

1. Cassandraの信頼性と人気

Cassandraは、特にMicrosoftやアマゾンが生成AIのための統合データベースを備えたクラウドサービスを推進する中で、実用データベースのリーダーです。これらのテクノロジー企業は、複雑なデータ移行プロセスを排除することで、ユーザーのプラットフォームへの移行を促しています。カプール氏は、これらのクラウドプロバイダーのソリューションの複雑さにユーモアを交えて批判し、「朝用、昼用、夕方用のトイレに行くようなものだ」と例えました。生成AIの普及に伴い、企業のCIOはシームレスなクエリのために統合データベースを求めており、Cassandraが特にそのニーズに応えています。一方、Microsoftやアマゾンのデータベースは主に分析業務に焦点を当てているため、生成AIに関連する運用タスクでのコスト効率が低下する恐れがあります。

データスタックスはコスト効果とパフォーマンスを重視しており、これがフォーチュン500企業への魅力となっています。Cassandraの著名な利用者には、映画MetaデータでのNetflix、パッケージ追跡でのFedEx、iCloudおよびiMessageデータでのApple、ウェブサイト運用でのHome Depotなどがあります。新しいAIアプリケーションを開発する企業は、Cassandraでの成功を基にこの技術の採用を強化しています。

2. 生成AIの積極的な導入

カプール氏は、生成AIのためにデータスタックスのAstra DBクラウドデータベースを活用している9社を挙げました。多くの企業が生成AIに取り組んでいるものの、実際の大規模な導入に移行しているところは少数で、安全性や信頼性に対する懸念が主な理由です。業界の緊張が高まる中、実際の展開に向けた支出のシフトが2024年には期待されます。

LLMを展開しているいくつかの顧客には、以下が含まれます:

- Physics Wallah:インドの教育プラットフォームで、550日で開発された多用途LLM駆動のボットが600万人のユーザーに利用されています。

- Skypoint:高齢者向け医療サービスで、個別の治療計画にLLMを使用し、医者の週あたり10時間以上の時間を節約しています。

その他、Hey You、Reel Star、Arre、Hornet、Restworld、Sourcetable、Concideなどがあります。カプール氏は、中小企業が迅速に適応できる一方で、大企業は規制のハードルに直面することを指摘しました。

3. 優れた技術パフォーマンス

カプール氏は、生成AIデータベースにおいて重要な要素であるAstraのベクトルサーチ機能の進展を強調しました。AstraのJVectorテクノロジーは、競合であるPineconeと比較して16%高い関連性を提供します。これは、精度の高い結果を得るために重要です。近日中に発表予定のベンチマークレポートでは、さらに詳細な洞察が得られる見込みですが、初期の結果では、AstraがPineconeやMongoDBと比較して優れた取引処理を実現していることが示されています。

Astra DBは、インデックス作成からクエリまでゼロレイテンシーでベクトル化データにアクセスできるという独自の特徴を持っています。

今後の展望:生成AIの急速な普及

カプール氏は、生成AIの普及がこれまでのテクノロジー革命よりも早く進展すると予測しており、ウェブ、モバイル、クラウド技術といった既存のフレームワークを基に展開されると期待しています。AIエージェントが複雑なタスクを実行できる高度なLLM機能を備えた収益を生み出すユースケースが2024年には登場する見込みです。特に小売や旅行業界において、生成AI統合からの実質的な収益が早ければ2024年第2四半期に現れる可能性があります。

カプール氏とアナフは、Cassandraの強みを強調しつつ、生成AIがデータベース業界全体を活性化することを認識しています。AIアプリケーションの需要が、ストレージや計算リソースの増加を必要とするため、クラウドおよびデータベースプロバイダーに注目が集まるでしょう。「AIアプリケーションが重要な存在になると、次の5年間では、プライベートのデータベース企業と公的なデータベース企業の成長ドライバーとなるだろう」とアナフ氏は述べました。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles