Une Interview Exclusive avec le Leader des Jailbreakers de ChatGPT et Expert des Autres LLMs Principaux

Home Actualités IA Une Interview Exclusive avec le Leader des Jailbreakers de ChatGPT et Expert des Autres LLMs Principaux

À 10h30, heure du Pacifique, le lundi 13 mai 2024, OpenAI a dévoilé son dernier modèle fondation IA, le GPT-4o, démontrant sa capacité remarquable à engager des conversations naturelles via des prompts audio. Ce système multimodal traite également efficacement les entrées audio, vidéo et texte téléchargées, offrant des réponses plus rapides et moins coûteuses par rapport aux versions précédentes.

Quelques heures plus tard, à 14h29 PT, le modèle a été accédé illégalement par un individu connu sous le nom de "Pliny the Prompter", qui a partagé un prompt spécifique sur le réseau social X contournant les restrictions de sécurité du modèle. Ce jailbreak a permis aux utilisateurs de générer du contenu explicite ou d'analyser des matériaux sensibles comme des images radiographiques, des fonctionnalités auparavant restreintes.

Pliny the Prompter n'est pas nouveau dans ce domaine. Il pirate des modèles de langage de grande taille (LLM) populaires comme Claude d'Anthropic et Gemini de Google depuis l'année dernière, produisant divers contenus controversés allant d'instructions illicites à des représentations visuelles non autorisées de célébrités.

En mai 2023, Pliny a fondé une communauté Discord intitulée "BASI PROMPT1NG" pour rassembler d'autres passionnés de jailbreak, favorisant la collaboration pour naviguer dans les limites imposées par les fournisseurs d'IA.

Le paysage actuel du jailbreak de LLM en 2024 reflète les tendances passées d’iOS, où les utilisateurs ont rapidement trouvé des moyens de personnaliser le logiciel strictement contrôlé d'Apple. Toutefois, avec les LLM, les jailbreakers pourraient accéder à des systèmes encore plus avancés et autonomes.

Mais qu'est-ce qui motive ces jailbreakers ? Sont-ils simplement des agents du chaos ou ont-ils des intentions plus profondes ? Nous avons mené une interview exclusive avec Pliny pour explorer ses motivations et perspectives sur l'IA :

a media : Quand avez-vous commencé à jailbreaker des LLM ? Avez-vous déjà réalisé un travail similaire auparavant ?

Pliny the Prompter : Je travaille là-dessus depuis environ 9 mois ; je n'avais jamais fait cela auparavant.

Quelles sont vos compétences les plus fortes dans ce domaine ?

Pliny the Prompter : Le jailbreak, les injections de prompts et les fuites de prompts systèmes. Cela nécessite de la créativité, de la reconnaissance de motifs et une pratique constante, ainsi qu'un solide bagage interdisciplinaire et de l'intuition.

Pourquoi jailbreakez-vous les LLM ? Quel impact espérez-vous avoir sur les utilisateurs et l'industrie technologique ?

Pliny the Prompter : Je n'aime pas les restrictions ; qu'on me dise que je ne peux pas faire quelque chose alimente ma persistance. Je vois le déblocage de l'IA non seulement comme une victoire personnelle, mais aussi comme un moyen de mettre en lumière les limites des systèmes de sécurité. Mon objectif est d'accroître la sensibilisation sur le véritable potentiel de l'IA et d'encourager une évolution vers la transparence.

Comment abordez-vous la recherche de failles dans les nouveaux modèles ?

Pliny the Prompter : J'analyse comment le système pense, s'il permet le jeu de rôle, ses capacités de production créative et ses interactions avec différents types de textes.

Avez-vous été contacté par des fournisseurs d'IA au sujet de votre travail ?

Pliny the Prompter : Oui, ils ont exprimé leur admiration pour mes compétences.

Êtes-vous inquiet des répercussions juridiques liées au jailbreak ?

Pliny the Prompter : Il y a toujours une certaine préoccupation, mais les lois autour du jailbreak de l'IA sont encore floues. Je n'ai jamais été banni, bien que j'aie reçu des avertissements. La plupart des organisations reconnaissent que cette forme de red teaming protège finalement leurs intérêts.

Comment réagissez-vous aux critiques qui considèrent le jailbreak comme dangereux ?

Pliny the Prompter : Bien que cela puisse sembler risqué, le red teaming responsable est crucial pour identifier et prévenir les vulnérabilités nuisibles au sein de l'IA. Les questions éthiques entourant les deepfakes suscitent également des discussions importantes sur la responsabilité dans le contenu généré par l'IA.

Qu'est-ce qui a inspiré votre nom, "Pliny the Prompter" ?

Pliny the Prompter : Je tire mon inspiration de Pline l'Ancien, une figure historique connue pour ses talents divers et son courage. Son esprit d'exploration résonne avec ma propre curiosité et ténacité.

À une époque où la technologie de l'IA évolue rapidement, les actions de jailbreakers comme Pliny the Prompter soulèvent des questions significatives sur l'éthique de l'utilisation de l'IA, les limites de la créativité et le dialogue en cours sur l'avenir de l'intelligence artificielle.

GamesBeat Summit 2024 : Tirer parti de l'IA pour renforcer la sécurité des joueurs dans le jeu vidéo

Zendata obtient 2 millions de dollars pour transformer la gouvernance de l'IA et la protection des données grâce à une plateforme innovante sans code.

Most people like

TextPixie AI Translator

6.1K

Découvrez un puissant outil de traduction gratuit qui prend en charge plus de 100 langues, facilitant la communication pour tous, partout. Que vous voyagiez, étudiiez ou que vous vous connectiez avec des amis à travers le monde, notre outil garantit que vos messages franchissent les barrières linguistiques sans effort.

Traducteur IA AI Image Recognition

RescapeAI

16.1K

Découvrez une application de design de jardin alimentée par l'IA qui génère des milliers d'idées novatrices pour transformer votre espace extérieur. Avec ses fonctionnalités avancées et ses recommandations personnalisées, cette application facilite l'imagination et la création de votre jardin de rêve. Libérez votre créativité et explorez dès aujourd'hui d'innombrables possibilités de conception de jardin.

design de jardin AI Design Generator

Reword Generator

25.9K

Donnez une nouvelle vie à votre écriture en toute simplicité.

générateur de reformulation AI Rewriter

IDScan.net

42.9K

Dans le paysage numérique d'aujourd'hui, garantir une vérification sécurisée de l'âge et de l'identité est plus crucial que jamais. Avec l'essor des interactions en ligne, les entreprises sont confrontées au défi de confirmer l'identité des utilisateurs tout en respectant les réglementations. Les solutions alimentées par l'IA révolutionnent la manière dont les organisations gèrent ces processus, offrant des méthodes de vérification précises, efficaces et évolutives. Découvrez comment la technologie de vérification de l'âge et de l'identité pilotée par l'IA peut améliorer la sécurité, rationaliser les opérations et se protéger contre la fraude dans un environnement en ligne de plus en plus complexe.

Numérisation d'identité AI Developer Tools

Find AI tools in YBX