企業のAI導入において、Retrieval Augmented Generation(RAG)のためのベクターデータベースが重要な役割を果たしていますが、本当の課題は非構造化データを効果的に管理することです。
Vectorizeの共同創設者兼CEOであるクリス・ラティマーは、以前DataStaxでクラウド関連のプロジェクトを指導していました。彼は、ベクターデータベース自体が企業におけるRAGの導入における主な障害ではないことに気付きました。むしろ、非構造化データをベクターデータベースに取り込み、生成AIを活用するための最適化が難しいという問題がありました。
そこでラティマーは10ヶ月前にVectorizeを立ち上げ、この課題に取り組むことにしました。最近、同社はTrue Venturesから360万ドルのシード資金を調達し、企業向けRAGプラットフォームの一般提供を開始しました。このプラットフォームは、近リアルタイムでのデータ処理を可能にし、エージェント型RAGアプローチを促進します。Vectorizeはデータエンジニアリングに特化し、企業がベクターデータベースや大規模言語モデル(LLM)向けにデータを準備・管理できるよう支援します。さらに、ユーザーは直感的なインターフェースを通じて迅速にRAGデータパイプラインを構築でき、さまざまな戦略をテストするためのRAG評価ツールも提供しています。
「生成AIプロジェクトの最終段階において、結果が期待に反することが多いことがわかりました」とラティマーは、独占インタビューで述べました。「ベクターデータベースに提供されたコンテキストが大規模言語モデルには不適切で、幻覚やデータの誤解釈につながっていました。」
Vectorizeの企業RAGスタックへの統合
Vectorize自体はベクターデータベースではなく、Pinecone、DataStax、Couchbase、Elasticなどの既存のベクターデータベースに非構造化データソースを接続するプラットフォームです。さまざまなソースからデータを取り込み、最適化し、生産準備が整ったデータパイプラインを提供します。このパイプラインは、取り込み、同期、エラーハンドリング、データエンジニアリングのベストプラクティスを含みます。
さらに、Vectorizeはベクターエンコーディング技術でもありません。ユーザーが異なるエンコーディングモデルやデータのチャンク方法を評価するのを支援し、特定のユースケースに最適な構成を見つけることができます。ラティマーは、OpenAIのAdaやSnowflakeが採用しているVoyage AIエンコーディングを含む多様なエンコーディングモデルから選択できる柔軟性を強調しました。「最良の結果を生み出すために革新的なデータベクトル化戦略に注力しています。」とラティマーは語り、このプラットフォームが生産準備が整ったソリューションを提供し、データエンジニアリングへの懸念を軽減することを強調しました。
エンタープライズRAGにおけるエージェントAIの活用
Vectorizeの際立った特徴は、「エージェント型RAG」アプローチです。これは伝統的なRAG手法とAIエージェント機能を組み合わせ、自律的な問題解決を促進します。AI推論用のSiriコンスタートアップGroqは、Vectorizeのエージェント型RAG機能を利用してAIサポートエージェントを強化しています。このエージェントは、Vectorizeのパイプラインから得たデータとコンテキストを使用して顧客の問い合わせに自律的に対応できます。
「顧客が繰り返し同じ質問をすると、エージェントは人の介入なしに効果的に解決すべきです。しかし、より複雑な問題に直面した場合は、人間にエスカレーションする必要があります。これがAIエージェントアーキテクチャの本質です。」とラティマーは説明しました。
エンタープライズRAGにおけるリアルタイムデータパイプラインの重要性
企業にとって、RAGを活用する大きな利点は最新データへのアクセスです。「古いデータは誤った意思決定をもたらします。」とラティマーは警告します。Vectorizeはリアルタイムおよび近リアルタイムでのデータ更新機能を提供し、顧客がデータの新鮮さの好みに応じてカスタマイズできるようにしています。「ユーザーが受け入れ可能なデータの古さに応じてプラットフォームを設定できるようにしています。」と彼は言います。「週次データの刷新が必要な場合でも、リアルタイム更新が必要な場合でも、私たちのプラットフォームはそれに対応し、データが利用可能になると同時にタイムリーに更新を提供します。」