研究者たちがChatGPTの可能性を解き放つ

Home AIニュース研究者たちがChatGPTの可能性を解き放つ

研究者たちは、AIチャットボットの内蔵された安全装置を回避する方法を発見しました。この新しい手法により、訓練プロセス中に異なるAIチャットボットを使用することで、以前は禁止されていたり敏感な話題について議論できるようになります。シンガポールの南洋理工大学（NTU）に所属するコンピュータ科学者チームは、この技術を非公式に「ジェイルブレイク」と呼び、正式には「マスターキー」プロセスと名付けています。この革新的なシステムでは、ChatGPT、Google Bard、Microsoft Bing Chatといったチャットボットが互いに競い合い、禁止されたトピックに対する制限を回避しながら学び合う二部構成の訓練戦略が採用されています。

この研究チームには、劉洋教授、および博士課程の学生である鄧偉さんと劉義さんが含まれています。彼らは共同でこの研究を行い、悪意のあるハッキング手法に類似した概念実証攻撃メソッドを開発しました。

最初に、チームは大規模言語モデル（LLM）を逆解析して、その保護メカニズムを明らかにしました。これらのメカニズムは、通常、暴力的、非道徳的、または悪意のある内容を含むプロンプトへの応答を防ぐものです。防御手段を理解することで、別のLLMを訓練し、回避策を作成できるようにしました。これにより、第二のモデルは、最初のモデルから得られた洞察に基づいて、より自由に応答できるようになります。マスターキーという名称は、将来LLMチャットボットがセキュリティ更新を受けた場合でも、その効果が残る可能性を示唆しています。驚くべきことに、マスターキーメソッドは、チャットボットのジェイルブレイクを行う従来の手法に比べて三倍の効果を発揮すると報告されています。

劉洋教授は、このプロセスがLLM AIチャットボットに備わった適応性と学習能力を強調していると述べています。研究チームは、マスターキー手法が従来の方法に比べて三倍効果的に制限を回避できることを示していると主張しています。興味深いことに、一部の専門家はGPT-4のようなLLMで見られる不具合が効率の向上を示していると反論し、パフォーマンス低下に対する批判に対抗しています。

2022年末にOpenAIのChatGPTが登場して以来、AIチャットボットの安全性と包括性を確保する動きは急速に進んでいます。OpenAIは、ChatGPTのサインアッププロセスに安全警告を取り入れ、意図しない言語問題に対処する更新を続けています。一方で、さまざまなチャットボットがある程度までの罵りや攻撃的な言語を容認するようになっています。

また、悪意のある行為者たちは、ChatGPTやGoogle Bard、類似のチャットボットの人気を迅速に利用し始めました。多くのソーシャルメディアキャンペーンでは、これらの製品へのリンクとして外見を装ったマルウェアが広がり、サイバー犯罪の新たなフロンティアとしてのAIの台頭を浮き彫りにしています。

NTUの研究チームは、研究に関与したAIチャットボットサービスプロバイダーと連携し、ジェイルブレイクの実現可能性を示す概念実証の結果を共有しました。彼らは、来年2月にサンディエゴで開催されるネットワークおよび分散システムセキュリティシンポジウムで研究成果を発表する予定です。

月額20ドルでコーパイロットの最高のオフィス機能を解放しよう！

GPT-4の劇的改善がユーザーに絶賛される理由

Most people like

AVCLabs Video Enhancer AI

199.7K

今日の視覚重視の世界では、高品質なビジュアルが観客の注意を引くために不可欠です。幸いなことに、人工知能（AI）の進歩は、私たちが動画や写真の品質を向上させる方法を革新しています。自動カラー補正からノイズ除去に至るまで、これらの革新的なツールはクリエイティブなプロフェッショナルや愛好者に、視覚コンテンツを容易に変換する能力を提供します。AI技術を統合することで、あなたのイメージを向上させ、競争の激しい現代の環境で際立つ素晴らしい結果を生み出す方法を発見しましょう。

AIビデオエンハンサー AI Image Enhancer

LegalForce

232.8K

契約レビュープロセスを私たちのAIプラットフォームで強化：品質と効率を向上急速に変化するビジネス環境において、契約レビューの正確性と効率性を確保することは重要です。私たちの革新的なAIプラットフォームは、契約分析の質を大幅に向上させながら、レビュー過程を効率化するように設計されています。先進的な人工知能を活用することで、契約管理がどのように変革するかをご覧ください。時間を節約し、エラーを減少させます。比類のない効率性と効果を持つ契約レビューの未来を受け入れましょう。

AI契約レビュー AI Contract Management

Playground AI

399.3K

Playground AIの無料オンラインAI画像クリエイターで、あなたの創造力を解き放ちましょう！魅力的なアート、興味を引く投稿、プロフェッショナルなプレゼンテーション、ユニークなロゴなどを簡単にデザインできます。AIの力を探求し、プロジェクトを一段と高めましょう！

画像生成器 AI Art Generator

ClipMove AI

351.1K

AI駆動のアシスタントでコンテンツ制作プロセスを革新しましょう。革新的な動画ジェネレーターと必須ツールのセットを備えています。マーケター、ブロガー、クリエイターに最適なこの強力なプラットフォームは、ワークフローを効率化し、魅力的な動画やコンテンツを簡単に制作できます。コンテンツ制作の未来を受け入れ、今日からあなたのプロジェクトを高めましょう！

AIコンテンツ制作 Text to Video

Find AI tools in YBX