Anthropicの最高情報セキュリティ責任者(CISO)であるジェイソン・クリントンは、CEOのダリオ・アモデイに直接報告を行い、多岐にわたる役割を担っています。彼は専任のチームと共に、Googleとアマゾンの支援を受けたこのスタートアップのデータや物理的なセキュリティを管理しており、高度な言語モデル「クロード」や「クロード2」で知られています。70億ドル以上の資金調達と約300人の社員を抱えるクリントンの主な焦点は、無断アクセスから守るべきテラバイトサイズのファイルに格納されたクロードのモデル重みの保護です。
機械学習、特に深層ニューラルネットワークにおいて、モデル重みはネットワークが学習し、予測を行うための重要な数値的接続を表します。これらの重みの最終的な値は、モデル全体のパフォーマンスに大きく影響します。最近のランド研究所の報告では、これらの重みを保護する重要性が強調されており、先進的なモデルのトレーニングに関わる広範なリソースと複雑なプロセスが集約されています。悪意のある者の手に渡った場合、これらの重みにより、訓練費用のごく一部でモデルへの完全アクセスが可能になります。
「おそらくCISOとしての私の時間のほぼ半分は、このファイルの保護について考えている」とクリントンは最近のインタビューで述べており、社内でこのファイルには多くの注目とリソースが注がれていることを指摘しています。
モデル重みに対する懸念
クリントンは、Googleでの11年間を経てAnthropicに移った際、モデル重みは非常に価値のある知的財産と考えられる一方で、同社の主要な関心はその技術が悪用されることを防ぐことであると強調しました。彼は、機会を狙った犯罪者やテロリスト、国家が誤用した場合の深刻な結果について警告しました。「攻撃者がファイル全体にアクセスした場合、それは全てのニューラルネットワークに相当します」と警戒を示しました。
この懸念は、最近の米国政府の取り組みにも反映されています。ホワイトハウスの「安全で安心、信頼できる人工知能の開発と利用に関する大統領令」は、基盤モデル企業に対してモデル重みの所有権やセキュリティ対策を文書化することを求めています。
新しい研究から特定された攻撃ベクトル
ランド研究所の最近の報告「人工知能モデル重みの保護」によると、共著者のセラ・ネボとダン・ラハブは、悪意のある者がモデル重みを盗むために悪用する可能性のある約40の攻撃ベクトルを特定しました。報告は、不正な物理的アクセスやサプライチェーン攻撃など、現実の例も交えてこれらのベクトルの実行例を強調しています。
ネボは、現在の能力よりも将来のリスクに焦点を当て、モデルの進化に伴い国家安全保障に重大な影響を及ぼすと予測しています。
オープンファウンデーションモデルのリスク
AIモデルの重み漏洩に関するリスクの深刻さについては、専門家の間でも意見が分かれています。スタンフォード大学のHAI政策の報告では、広く利用可能なオープンファウンデーションモデルがイノベーションや透明性を促進する可能性があるとし、これらのモデルに関連するリスクをクローズドモデルと比較して評価すべきと提言しています。デモクラシー技術センターのケビン・バンクストンは、バランスの取れたエビデンスに基づいた分析が評価されるとコメントしました。報告は、MetaのLlama 2モデルが以前の漏洩にもかかわらず一般公開されていることに触れ、混合した結果を示しています。
オープンソースのセキュリティを支持する一方で、ジョージタウン大学のヘザー・フレースは、生成モデルが進化するにつれて、特に悪意のある技術によって標的にされる個人に対する潜在的な危険が増加することを指摘しました。
セキュリティにおけるオープン性の強調
Hugging Faceの機械学習エンジニア、ニコラス・パトリーは、モデル重みに関連するリスクには定期的なセキュリティプロトコルが求められると述べていますが、透明性がセキュリティを向上させると信じています。Lightning AIのCEO、ウィリアム・ファルコンも同様の見解を示し、モデル重みの漏洩を制御しようとする試みは無駄であるとし、オープンソースコミュニティの急速な進化を指摘しました。
クリントンは、オープンソースモデルがAnthropicが優先すべき最大のリスクを引き起こしていないことに同意し、政府は「フロンティア」モデルの規制に注力し、継続的な研究とセキュリティの重要性を強調すべきだと語っています。
継続するセキュリティの課題
研究者からは楽観的な見方が示されていますが、ネボは油断に警戒を呼びかけ、現在のセキュリティ対策が将来の脅威に十分に対処できない可能性があると警告しています。クリントンは、AIセキュリティの人材不足が課題であるとし、「AIセキュリティの専門家がいない…私たちは、急速に進化する環境に適応できる優れたセキュリティエンジニアが必要だ」と述べました。
彼は、攻撃者が脆弱性を利用する容易さの増加について懸念を示し、将来のサイバーセキュリティの実践が定期的な更新から日次の更新に移行することを予測しています。これには業界全体でのマインドセットの大きな変化が必要です。
クリントンの急速な研究の進展と強固なセキュリティ対策のバランスを取る姿勢は、AIモデルの重みを保護するための迅速な戦略の重要性を強調しています。「私たちの研究チームが安全にモデル重みを管理できるよう、サポートを感じることが重要です」と彼は結論づけました。