リトリーバル・オーグメンテッド・ジェネレーション(RAG)におけるエンタープライズAIの分野では、埋め込みモデルが重要な役割を果たしています。これらのモデルは、さまざまなコンテンツをベクトルに変換し、AIシステムが理解できる形にします。OpenAIのAda埋め込みモデルは、この分野の先駆者でしたが、多くの企業が特定のアプリケーションに必要な精度を欠いていることに気づきました。そこで登場するのがVoyage AIです。
最近、Voyage AIは、エンタープライズ向けRAGアプリケーション専用の埋め込みおよびリトリーバルモデルを強化するために、2000万ドルのSiriーズA資金調達を発表しました。この資金調達には、Snowflakeからの重要な後押しがあります。SnowflakeはVoyage AIのモデルを自社のCortex AIサービスに統合する計画を立てており、これによりCortex AIの検索機能が向上します。この統合は、SnowflakeがAI検索企業Neevaを買収した際に得た技術を活用します。
Voyage AIは、企業向けのRAG機能を強化することに専念しており、その多言語対応埋め込みモデルは27言語をサポートし、驚くべき精度を誇ります。Voyage AIの創設者兼CEOであるマ・テンギュは、「リトリーバルの質を向上させることでRAGを改善します。より関連性の高い文書は、より良い応答を生み出します。そうでなければ、大規模言語モデルは不正確な出力を生成する可能性があります」と述べました。
エンタープライズRAGのための優れた埋め込みの強化
埋め込みモデルは、大規模言語モデル(LLM)を訓練し、RAGシステムを実装するために不可欠です。マ氏は、Voyage AIが特定のドメイン情報のリトリーバル品質を向上させるための高度な埋め込みおよび再ランクモデルの創造に注力していることを強調しました。企業の精度要求が高まる中、OpenAIのAdaなどの既存ソリューションは不十分であると指摘しています。「私たちの埋め込みは、複雑な概念をより深く理解するための高い精度を提供します」とマ氏は説明しました。
Voyage AIは、高度な技術を通じて精度を向上させており、データ収集やフィルタリングを含む訓練パイプライン全体を最適化しています。同社は、金融、コーディング、法律などの特定の業界向けにモデルをカスタマイズし、これらの分野で優れたパフォーマンスを実現しています。
コントラスト学習の役割
機械学習モデルの訓練は、特にラベル付けされていないデータでの取り組みが難しい場合があります。このようなデータを効果的に活用するために、Voyage AIは従来の次の単語予測手法とは異なるコントラスト学習を採用しています。「ラベルのないデータからコントラストペアを作成して、モデルを訓練しています」とマ氏は語ります。
SnowflakeとVoyage AIのパートナーシップ
Snowflakeにとって、Voyage AIとの提携やそのモデルをCortex AIサービスに組み込むことは、エンタープライズユーザーの利便性を向上させることを目指しています。SnowflakeのエンジニアリングSVPであるヴィヴェク・ラグナタン氏は、「すべてのプロバイダーがRAGシステムの開発に努めています。当社のアプローチは、構造化データと非構造化データの両方にシームレスにアクセスできることを可能にします」と述べました。
ラグナタン氏は、Voyage AIのモデルの高度な機能に対する期待感を示し、特に多言語対応や拡張コンテキストウィンドウがエンタープライズアプリケーションにとって重要であると強調しました。Snowflakeは自社のArctic埋め込みモデルを提供していますが、Voyage AIはユーザーにとって魅力的な代替手段を提供します。「効率と質のバランスを考慮してください。私たちのモデルは、難しいユースケースに対処する点で優れています」とラグナタン氏は締めくくりました。