コヒア(Cohere)は、企業向けの検索および情報取得を変革する最先端の基盤モデル「Rerank 3」を発表しました。この革新的なモデルは、JSON、メール、テーブルなど、複雑なデータソースから実用的な洞察を抽出する企業の能力を大幅に向上させます。さらに、Rerank 3は多言語に対応しています。
コヒアの機械学習ディレクター、ニルス・ライマーズ(Nils Reimers)は、Rerank 3の独自の機能について次のように述べました。「JSONやメール、テーブルといった複雑なデータ形式の検索は、これまで大きな課題でした。Rerank 3は、入力データの要素を独立して表現することで、複雑な企業データの取り扱いを飛躍的に改善しています。」
Rerank 3の際立った特徴の一つは、4,000トークンという驚異的なコンテキスト長です。これにより、長い文書の検索品質が向上し、データのセグメンテーションが不要になります。ライマーズは「以前の検索手法は約300語に制限されていたため、テキスト内の長い関係を特定するのが難しかった。Rerank 3は4,000トークンにわたるつながりを確立できるよう入念に訓練されており、複雑な問い合わせに対する大きな進歩を提供します」と説明しました。
さらに、Rerank 3は、GPT-4やMistral、Claudeなどの主要な大規模言語モデルに比べて、コストを抑えた高精度の結果を提供します。TREC 2020データセットのデータによって証明されています。
エラスティックとの統合とパートナーシップ
Rerank 3のもう一つの大きな利点は、情報検索生成(RAG)システムとのシームレスな統合です。これにより、さまざまな企業アプリケーションで結果の精度とコスト効率が向上します。「Rerank 3は最も関連性の高い文書を優先し、ユーザーが大規模言語モデル(LLM)に提供するコンテキストを減らすことで、より早く、経済的な応答を可能にします」とライマーズは述べています。
コヒアは、エラスティック(Elastic)との提携により、Rerank 3がエラスティックの推論APIにネイティブで対応することを保証し、Elasticsearchを利用する開発者が強化された再ランキング機能を活用できるようにします。「既存のElasticsearchインデックスにデータがある開発者は当社の強化機能を活用できます。我々はエラスティックとの協力を深め、強力な企業ソリューションを共に推進することに大きな期待を寄せています」とも述べています。
Rerank 3は、Rerank 2と比べて長文検索の精度を5.9%向上させ、企業が最大4,000トークンの長文書を効率的に検索できるようにしています。
企業データの複雑さへの挑戦
Rerank 3のような基盤モデルが企業にとって不可欠になる中、コヒアはこれらの技術の責任ある開発と実装に力を入れています。「コヒアは、企業クライアントのためのデータプライバシーとセキュリティを最優先しています。私たちの製品はデータプライバシーを基盤として構築されています」とライマーズは強調しました。
Rerank 3の導入により、コヒアは自然言語処理と企業向けAIソリューションの進化する分野の先駆者である地位を強化しています。複雑なデータ課題に責任を持って取り組む姿勢は、先進的な検索および情報取得技術の活用を望む企業にとって魅力的な選択肢となっています。
ライマーズは「Rerank 3は半構造化データや表形式データに非常に大きな可能性をもたらします。この新機能は企業にとって新たな機会を提供します」と述べ、コヒアのリードでそれらの機会がこれまで以上に身近なものになっていることを強調しました。