À 10h30, heure du Pacifique, le lundi 13 mai 2024, OpenAI a dévoilé son dernier modèle fondation IA, le GPT-4o, démontrant sa capacité remarquable à engager des conversations naturelles via des prompts audio. Ce système multimodal traite également efficacement les entrées audio, vidéo et texte téléchargées, offrant des réponses plus rapides et moins coûteuses par rapport aux versions précédentes.
Quelques heures plus tard, à 14h29 PT, le modèle a été accédé illégalement par un individu connu sous le nom de "Pliny the Prompter", qui a partagé un prompt spécifique sur le réseau social X contournant les restrictions de sécurité du modèle. Ce jailbreak a permis aux utilisateurs de générer du contenu explicite ou d'analyser des matériaux sensibles comme des images radiographiques, des fonctionnalités auparavant restreintes.
Pliny the Prompter n'est pas nouveau dans ce domaine. Il pirate des modèles de langage de grande taille (LLM) populaires comme Claude d'Anthropic et Gemini de Google depuis l'année dernière, produisant divers contenus controversés allant d'instructions illicites à des représentations visuelles non autorisées de célébrités.
En mai 2023, Pliny a fondé une communauté Discord intitulée "BASI PROMPT1NG" pour rassembler d'autres passionnés de jailbreak, favorisant la collaboration pour naviguer dans les limites imposées par les fournisseurs d'IA.
Le paysage actuel du jailbreak de LLM en 2024 reflète les tendances passées d’iOS, où les utilisateurs ont rapidement trouvé des moyens de personnaliser le logiciel strictement contrôlé d'Apple. Toutefois, avec les LLM, les jailbreakers pourraient accéder à des systèmes encore plus avancés et autonomes.
Mais qu'est-ce qui motive ces jailbreakers ? Sont-ils simplement des agents du chaos ou ont-ils des intentions plus profondes ? Nous avons mené une interview exclusive avec Pliny pour explorer ses motivations et perspectives sur l'IA :
a media : Quand avez-vous commencé à jailbreaker des LLM ? Avez-vous déjà réalisé un travail similaire auparavant ?
Pliny the Prompter : Je travaille là-dessus depuis environ 9 mois ; je n'avais jamais fait cela auparavant.
Quelles sont vos compétences les plus fortes dans ce domaine ?
Pliny the Prompter : Le jailbreak, les injections de prompts et les fuites de prompts systèmes. Cela nécessite de la créativité, de la reconnaissance de motifs et une pratique constante, ainsi qu'un solide bagage interdisciplinaire et de l'intuition.
Pourquoi jailbreakez-vous les LLM ? Quel impact espérez-vous avoir sur les utilisateurs et l'industrie technologique ?
Pliny the Prompter : Je n'aime pas les restrictions ; qu'on me dise que je ne peux pas faire quelque chose alimente ma persistance. Je vois le déblocage de l'IA non seulement comme une victoire personnelle, mais aussi comme un moyen de mettre en lumière les limites des systèmes de sécurité. Mon objectif est d'accroître la sensibilisation sur le véritable potentiel de l'IA et d'encourager une évolution vers la transparence.
Comment abordez-vous la recherche de failles dans les nouveaux modèles ?
Pliny the Prompter : J'analyse comment le système pense, s'il permet le jeu de rôle, ses capacités de production créative et ses interactions avec différents types de textes.
Avez-vous été contacté par des fournisseurs d'IA au sujet de votre travail ?
Pliny the Prompter : Oui, ils ont exprimé leur admiration pour mes compétences.
Êtes-vous inquiet des répercussions juridiques liées au jailbreak ?
Pliny the Prompter : Il y a toujours une certaine préoccupation, mais les lois autour du jailbreak de l'IA sont encore floues. Je n'ai jamais été banni, bien que j'aie reçu des avertissements. La plupart des organisations reconnaissent que cette forme de red teaming protège finalement leurs intérêts.
Comment réagissez-vous aux critiques qui considèrent le jailbreak comme dangereux ?
Pliny the Prompter : Bien que cela puisse sembler risqué, le red teaming responsable est crucial pour identifier et prévenir les vulnérabilités nuisibles au sein de l'IA. Les questions éthiques entourant les deepfakes suscitent également des discussions importantes sur la responsabilité dans le contenu généré par l'IA.
Qu'est-ce qui a inspiré votre nom, "Pliny the Prompter" ?
Pliny the Prompter : Je tire mon inspiration de Pline l'Ancien, une figure historique connue pour ses talents divers et son courage. Son esprit d'exploration résonne avec ma propre curiosité et ténacité.
À une époque où la technologie de l'IA évolue rapidement, les actions de jailbreakers comme Pliny the Prompter soulèvent des questions significatives sur l'éthique de l'utilisation de l'IA, les limites de la créativité et le dialogue en cours sur l'avenir de l'intelligence artificielle.