Anthropicがアップグレード版Claude 3.5モデルを発表:AIエージェントの新時代を迎える
2023年10月22日、Anthropicは強化されたClaude 3.5 Sonnetと新しいClaude 3.5 Haikuモデルの発表を行いました。特にClaude 3.5 Sonnetはプログラミング能力の大幅な向上と、「コンピュータ使用」機能の導入を実現しています。この新機能により、AIは人間のようにコンピュータと対話し、カーソルを動かしたり、クリックしたり、バーチャルキーボードを通じて入力したりすることができます。
アップグレードされたClaude 3.5 Sonnetは、現在テストフェーズにてユーザーが体験できる状態となっており、コーディングなどの分野で顕著な進歩を示しています。Anthropicのチーフサイエンティスト、ジャレッド・カプランは、「我々は、モデルが人間と同じようにさまざまなツールを使ってタスクを完了できる新しい時代に突入しています」と述べています。
Claude 3.5 Sonnetの登場は、商業用AIモデルの風景において重要な前進を示しています。その目標は、従来のチャットインターフェースを超えて、真の「AIエージェント」へと進化することです。これらのAIエージェントは、ソフトウェアを操作し、人間のユーザーと同様の方法でコンピュータ作業を遂行できます。Cognition AIのDevinなど他のモデルがプログラミングに特化しているのに対し、AnthropicのAIエージェントはウェブブラウジングや多様なアプリケーションの利用といった広範な機能を備えています。
Wiredのデモンストレーションでは、Claudeにゴールデンゲートブリッジでの日の出を見るための旅行計画を任せると、AIはウェブブラウザを開いて最適な観賞地点を調べ、カレンダーに日程を追加しました。しかし、Wiredによると、Claudeは目的地へのアクセス方法などの実用的な詳細を見逃しました。別の例では、ClaudeにMicrosoft Visual Studio Codeを使用して簡単なウェブサイトを作成させると、地元のサーバーを開くことに成功し、指示があれば小さなエラーを修正しました。
これらのAIモデルの可能性は有望ですが、特にコーディングタスクにおいて信頼性が懸念されます。TechCrunchによれば、Claude 3.5 Sonnetは、飛行機の予約などの簡単なテストで半数以上のタスクを完了できないことがありました。
また、AIエージェントにはともに考慮すべきセキュリティリスクがあります。ユーザーは、これらの不安定で予測不可能な技術に自らのコンピュータやウェブブラウザへのアクセスを許可することに抵抗を感じるかもしれません。これに対し、Anthropicは、この限られたが比較的安全なAIモデルを段階的に導入することでセキュリティを向上させることができると強調しています。同社は「より強力なモデルを待つのではなく、既存のより安全なモデルがコンピュータと対話することで、潜在的な問題を観察し対応し始め、安全対策を徐々に強化することが重要です」と述べています。
AI技術の急速な進化に伴い、Claude 3.5 SonnetのリリースはAIエージェントの新たな章の始まりを示しています。今後の進展がより安全で信頼性の高いソリューションにつながることが期待されています。