Anthropic、Claude 3を発表:ベンチマークテストでGPT-4とGemini Ultraを超える性能を見せる

Anthropic、著名な人工知能スタートアップ企業が、その企業顧客の多様なニーズに応えるために、インテリジェンス、スピード、コスト効率に重点を置いたClaude 3SiriーズのAIモデルを発表しました。このSiriーズには、Opus、Sonnet、および近日中に発売予定のHaikuの3つのモデルが含まれています。

最前線にはOpusがあり、Anthropicはこれが他のすべての公開AIシステムを凌駕すると主張しています。OpenAIやGoogleの先進モデルも上回るとのことです。

Anthropicの共同創設者でCEOのダリオ・アモデイ氏は、「Opusは幅広いタスクで卓越したパフォーマンスを発揮します」と述べ、数学的推論のためのGSM-8kや専門知識のためのMMLUを含むさまざまなベンチマークで、OpusがGPT-4、GPT-3.5、Gemini Ultraといったトップモデルを上回ることができると語りました。「競合他社を一貫して上回る得点を達成しており、多くのタスクで前例のない結果を出しています」とアモデイ氏は共有しました。

競合の主導的なモデルのパラメータは公開されていないものの、Anthropicの報告されたベンチマーク結果は、OpusがGPT-4やGeminiなどの主要オルタナティブと同等またはそれ以上のコア機能を持つことを示唆しています。これにより、商業用会話AIの新たな基準が設定されました。

複雑な推論タスク向けに設計されたOpusは、Anthropicのラインアップ内で優れたパフォーマンスを発揮します。中程度のニーズを持つ企業向けには、Sonnetがコスト効率の良いルーチンデータ分析および知識ワークを提供し、パフォーマンスを損なうことなく機能します。一方、Haikuはスピードと手頃な価格を重視して設計されており、チャットボットのような消費者向けアプリケーションに最適です。アモデイ氏は、Haikuの公開が「数週間内に行われる」と予測しています。

新しいSiriーズの各モデルは、画像入力機能を備えており、画像内のテキスト認識などのアプリケーションに対する需要の高まりに応えています。「私たちの焦点は、企業からの最も要求される機能にあります」とAnthropicの社長ダニエラ・アモデイ氏は述べ、関連機能を優先する企業の戦略を強調しました。

Claude 3モデルは高度なコンピュータビジョン機能を持ち、この強化により企業は画像、文書、チャート、図から情報を効率的に抽出できます。「多くの顧客データは非構造化または視覚的なものであり、手動での抽出は手間がかかります」とダニエラ氏は指摘し、法務、財務、ロジスティクス、品質保証などの分野での潜在的な応用を示しました。

Anthropicの発表は、特にGoogleのGeminiチャットボットが現実を正確に反映しない歴史的画像を生成したとの批判を受けた後、AIのバイアスに関する議論の中で行われました。Googleは一時的にGeminiの画像生成機能を無効にし謝罪しましたが、これはテクノロジー企業がAIのバイアスに対処する際の課題を浮き彫りにしています。

ダリオ・アモデイ氏はAIバイアスをナビゲートする難しさを認め、「これは不正確な科学です」と語り、Anthropicはモデルに関連するリスクを評価し軽減するための専門チームを持っていることを強調しました。「私たちの仮説は、先進AI開発が技術を社会的にポジティブな成果に向けて導くことです」とダリオ氏は述べました。しかし、ダニエラ氏は、完全にバイアスのないAIを実現する難しさを強調しました。「中立的な生成AIツールを作成することはほぼ不可能です。なぜなら、中立が何を意味するのかに関する解釈が異なるからです」と彼女はコメントしました。

Anthropicの戦略は、「憲法」に定義された原則にモデルを整合させることを目的とした“憲法AI”として知られるアプローチを含んでいます。意図に反して、ダリオ氏はバイアス軽減の完璧さを達成することは依然として難しいと認めています。「私たちはイデオロギー的中立性を目指していますが、完璧にはなっていません。誰もができていないのです」と彼は述べました。

最終的に、ダリオ氏はAnthropicの広く受け入れられた価値観へのコミットメントは、モデルが特定の政党のアジェンダに偏らないようにすることを目指していると主張しました。最近のGeminiの批判とは対照的です。「私たちの目標は、特定の政治的視点を助長することなく、多様なオーディエンスにサービスを提供するモデルを作成することです」と彼は結論しました。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles