Des chercheurs dévoilent le potentiel de ChatGPT.

Home Actualités IA Des chercheurs dévoilent le potentiel de ChatGPT.

Updated on octobre 25 2024

Des chercheurs ont découvert une méthode pour contourner les protections intégrées des chatbots IA, leur permettant d'aborder des sujets précédemment interdits ou sensibles en utilisant un autre chatbot pendant le processus de formation. Une équipe de scientifiques de l'informatique de l'Université Technologique de Nanyang (NTU) à Singapour se réfère informellement à cette technique sous le nom de « jailbreak », tout en l'appelant officiellement le processus « Masterkey ». Ce système innovant met en concurrence les chatbots comme ChatGPT, Google Bard et Microsoft Bing Chat dans une stratégie de formation en deux parties, leur permettant d'apprendre des cadres des autres et de contourner les restrictions sur les sujets prohibés.

L'équipe de recherche comprend le professeur Liu Yang, ainsi que les doctorants M. Deng Gelei et M. Liu Yi, qui ont collaboré à l'étude et développé des méthodes d'attaque de preuve de concept ressemblant à une approche de piratage malveillant. Au départ, l'équipe a procédé à une ingénierie inverse d'un grand modèle de langage (LLM) pour dévoiler ses mécanismes de protection, qui empêchent généralement les réponses à des demandes contenant du contenu violent, immoral ou malveillant. En comprenant ces mesures défensives, ils ont formé un autre LLM pour créer une solution de contournement, permettant à ce second modèle de répondre plus librement en se basant sur les connaissances acquises du premier modèle. Le terme « Masterkey » reflète l'efficacité potentielle du processus, suggérant qu'il peut toujours fonctionner même si les chatbots LLM reçoivent des mises à jour de sécurité améliorées à l'avenir. De manière remarquable, la méthode Masterkey surpasserait les techniques traditionnelles de jailbreak des chatbots par un facteur de trois.

Le professeur Liu Yang a souligné que ce processus met en lumière l'adaptabilité et les capacités d'apprentissage des chatbots IA LLM. L'équipe de recherche affirme que la méthode Masterkey a montré une efficacité trois fois supérieure pour contourner les restrictions par rapport aux méthodes traditionnelles. Fait intéressant, certains experts soutiennent que les anomalies rencontrées par certains LLM, comme GPT-4, signalent un avancement plutôt qu'une baisse d'efficacité, contrecarrant les critiques sur une performance diminuée.

Depuis l’émergence des chatbots IA fin 2022, suite au lancement de ChatGPT par OpenAI, un élan important s'est créé pour garantir que ces plateformes soient sécurisées et inclusives pour tous les utilisateurs. OpenAI a mis en place des avertissements de sécurité lors du processus d'inscription à ChatGPT et continue d’émettre des mises à jour pour traiter les potentielles problématiques linguistiques non intentionnelles. En revanche, plusieurs variantes de chatbots ont commencé à tolérer, dans une certaine mesure, des jurons et un langage offensant.

De plus, des acteurs malveillants ont rapidement commencé à exploiter la popularité de ChatGPT, Google Bard et chatbots similaires avant qu'ils ne deviennent largement accessibles. De nombreuses campagnes sur les réseaux sociaux ont diffusé des malwares déguisés en liens vers ces produits, mettant en lumière l’IA comme une nouvelle frontière pour la cybercriminalité.

L'équipe de recherche de la NTU a engagé le dialogue avec les fournisseurs de services de chatbots impliqués dans leur étude pour partager leurs résultats de preuve de concept, démontrant que la capacité de jailbreaker des chatbots est effectivement réalisable. Ils présenteront leurs recherches au Symposium de Sécurité des Réseaux et des Systèmes Distribués à San Diego, en février prochain.

Débloquez les meilleures fonctionnalités de Copilot pour seulement 20 $ par mois !

Voici pourquoi les utilisateurs sont enthousiastes face aux améliorations remarquables de GPT-4.

Most people like

Wordhero

85.2K

WordHero est un outil d'écriture IA avancé conçu pour vous aider à créer du contenu de haute qualité rapidement et sans effort.

Autre AI Content Generator

Promptzone

32.8K

Bienvenue sur notre plateforme innovante dédiée à la promotion de la créativité grâce au pouvoir des idées partagées. Ici, les utilisateurs peuvent explorer une vaste collection de suggestions créatives conçues pour inspirer écrivains, artistes et penseurs. En vous connectant à une communauté dynamique, vous découvrirez non seulement des suggestions uniques, mais aussi l'opportunité de partager les vôtres, enrichissant ainsi l'expérience créative de tous. Rejoignez-nous dès aujourd'hui pour libérer votre imagination et élever vos projets créatifs !

Invitations créatives Prompt

BuzzBoard

47.6K

BuzzBoard est une plateforme de vente avancée alimentée par l'IA, conçue pour renforcer la confiance des représentants commerciaux et favoriser leur succès grâce à un contenu personnalisé.

Plateforme de vente alimentée par l'IA Sales Assistant

EdrawMax Online

792.6K

Créez des visuels époustouflants avec notre créateur de diagrammes en ligne Élevez vos projets et présentations grâce à notre créateur de diagrammes en ligne intuitif. Concevez des visuels de qualité professionnelle sans effort, en utilisant des modèles personnalisables et des outils faciles à utiliser. Que vous ayez besoin de diagrammes de flux, de cartes heuristiques ou d'organigrammes, notre plateforme vous permet de communiquer vos idées de manière claire et efficace. Commencez à créer des diagrammes impressionnants dès aujourd'hui !

créateur de diagrammes AI Diagram Generator

Find AI tools in YBX