Resemble AIの最先端音声検出モデル「Detect-2B」、AI分析において94%の精度を実現!

音声クローン企業Resemble AI、先進的なディープフェイク検出モデル「Detect-2B」を発表

音声クローン企業Resemble AIは、次世代のディープフェイク検出モデル「Detect-2B」を発表しました。このモデルは、驚異的な精度94%を誇ります。

革新的なモデルアーキテクチャ

Detect-2Bは、事前にトレーニングされたサブモデルをいくつも組み合わせ、微調整を行うことで、音声クリップの解析を行い、AI生成かどうかを判断します。「従来のDetectモデルに基づき、Detect-2Bはモデルのアーキテクチャ、トレーニングデータ、パフォーマンスにおいて大きな進歩を遂げました。この結果、実際の音声と人工音声を区別する高い信頼性を持つディープフェイク検出ツールが誕生しました」と、同社はブログで述べています。

音声のアーティファクトに注目

Detect-2Bは、音声データの特徴を捉えるために音声表現モデルと適応モジュールを組み込み、このモジュールが音声アーティファクトに焦点を当てます。通常、AI生成音声は「過剰にクリーン」に聞こえますが、Detect-2Bは再トレーニングなくAI生成部分を推定できます。サブモデルは広範なデータセットでトレーニングされており、信頼性が高まっています。

スムーズな予測プロセス

Detect-2Bは予測スコアを集計し、「精密に調整された閾値」と比較して録音の真実性を判定します。Resembleは、Detect-2Bの設計が効率的なトレーニングを実現し、計算リソースを最小限に抑えることができると強調しています。

ランダム化されたモデルアーキテクチャ

このモデルは、静的データや繰り返しパターンに依存しないMamba-SSM、または状態空間モデルを用いています。確率的モデルを採用することで、多様な音声条件に対応しやすく、音声のダイナミクスを捉えるのに優れています。低品質な録音でも安定して機能します。

強力な多言語性能

Detect-2Bは、見知らぬ話者やディープフェイク音声、複数の言語を含む多様なテストセットで評価され、6つの言語でディープフェイク音声を93%以上の精度で特定しました。

統合とアクセスの容易さ

Detect-2BはAPIを通じて利用可能で、さまざまなアプリにスムーズに統合できます。このリリースは、Resembleが4月に発表したAI音声プラットフォーム「Rapid Voice Cloning」に続くものです。

現代におけるディープフェイク検出の重要性

2024年のアメリカ大統領選挙が近づく中、AI生成音声や動画を識別する必要性が高まっています。AI音声による誤情報の拡散は、特に公人のディープフェイクにおいて懸念されており、メディアの誤表現が消費者の信頼を損なっています。Detect-2Bのようなツールは、公開前のコンテンツを検証する上で不可欠です。

研究開発の継続

Resembleは、検出技術の旅が始まったばかりであることを認識しています。「生成AI技術が進化する中で、私たちの検出技術も進化させなければなりません。DETECT-2Bを強化するために、表現学習や先進的なモデルアーキテクチャ、データの拡張に焦点を当てた興味深い研究方向を計画しています」と同社は述べています。

Most people like

Find AI tools in YBX