最近、OpenAIの競合であるAnthropicは、ClaudeSiriーズのAIモデルのシステムプロンプトを公開することで、生成AI業界における透明性の新たな基準を確立しました。この動きは、AIシステムの内部動作を明らかにする重要なステップと業界関係者に評価されています。
システムプロンプトは、大規模言語モデル(LLM)の操作指示として機能し、ユーザーとの対話中に従うべき一般的なガイドラインを示します。また、モデルのトレーニングに使用される情報のカットオフ日も示しています。
多くのLLMはシステムプロンプトを使用していますが、すべてのAI企業がこの情報を公開しているわけではなく、そのため「AI脱獄者」と呼ばれる人物がこれらを暴こうとする試みが増加しています。Anthropicは、Claude 3.5 Sonnet、Claude 3 Haiku、そしてClaude 3 Opusの操作指示を自社のウェブサイトのリリースノートセクションに掲載することで、これらの試みを事前に上回っています。
さらに、Anthropicの開発者関係担当責任者であるアレックス・アルバートは、X(旧Twitter)上でClaudeのシステムプロンプトに関する変更を公表し続けると約束しました。「Claude dot aiやモバイルアプリでのデフォルトシステムプロンプトの変更を記録していきます」と発言しています。
Anthropicのシステムプロンプトから得られる洞察
Claude 3.5 Sonnet、Claude 3 Haiku、Claude 3 Opusの各システムプロンプトは、各モデルの能力、知識のカットオフ日、そして独自の個性に関する貴重な情報を提供しています。
- Claude 3.5 Sonnetは最も進んだモデルで、2024年4月までの知識ベースを持ちます。複雑な問い合わせには詳細な回答を提供し、シンプルな質問には簡潔な応答を行います。このモデルは物議を醸すテーマに慎重に対処し、敏感な情報とすることなく情報を提示します。また、無駄な表現を避け、画像入力における顔認識を認めることはありません。
- Claude 3 Opusは2023年8月まで更新されており、複雑なタスクとライティングの管理に優れています。Sonnetと同様に、基本的な質問には簡潔な回答を、複雑な質問には詳細な回答を提供します。Opusは物議を醸すトピックに対して多様な視点を提示し、ステレオタイプを避けてバランスの取れた意見を確保しますが、Sonnetに見られるような詳細な行動ガイドラインは一部欠けています。
- Claude 3 HaikuはClaudeファミリーの中で最も高速なモデルで、2023年8月までの更新があります。シンプルな質問に対して迅速かつ簡潔な回答を重視し、より複雑な問題には徹底した回答を提供します。プロンプトの構成はシンプルで、スピードと効率性に焦点を当てています。
AIにおける透明性の重要性
生成AIシステムに対する主要な批判の一つは、「ブラックボックス」現象で、モデルの判断の背後にある理由が不透明である点です。この問題は、モデルが予測を行う方法の理解を深めるためのAI説明可能性に関する研究を促進しています。システムプロンプトを公開することで、Anthropicはこの透明性のギャップに対処する一歩を踏み出し、ユーザーがモデルの動作を理解できるようにしています。
Anthropicのこの取り組みはAI開発コミュニティに好意的に受け入れられ、AI企業の透明性の向上を促進する動きを強調しています。
開放性の限界
AnthropicはClaudeモデルのシステムプロンプトを公開しましたが、モデル全体をオープンソースにはしていません。実際のソースコード、トレーニングデータセット、およびモデルの重みはAnthropicの専有物です。しかしながら、この取り組みは他のAI企業が透明性を高めるための道を示しており、ユーザーが自らのAIチャットボットの設計意図を明確に理解する助けとなるでしょう。