Une étude révèle des vulnérabilités d'Alexa, Siri et Google Assistant face à des commandes malveillantes.

Home Actualités IA Une étude révèle des vulnérabilités d'Alexa, Siri et Google Assistant face à des commandes malveillantes.

Une étude récente des chercheurs d'Amazon Web Services (AWS) a révélé de sérieuses vulnérabilités de sécurité dans les modèles de langage à grande échelle (LLMs) capables de comprendre et de répondre à la parole. Intitulé « SpeechGuard : Exploration de la robustesse adversariale des modèles de langage multimodaux », cet article montre comment ces systèmes d'IA peuvent être manipulés pour générer des réponses nuisibles ou contraires à l'éthique à travers des attaques audio conçues stratégiquement.

À mesure que les interfaces vocales deviennent de plus en plus courantes—des enceintes intelligentes aux assistants IA—il est essentiel d'assurer leur sécurité et leur fiabilité. La recherche indique qu'en dépit des mesures de sécurité existantes, les modèles de langage de la parole (SLMs) restent très sensibles aux « attaques adversariales ». Ces attaques consistent en de légères altérations de l'entrée audio, indétectables par les humains, mais capables de changer radicalement la sortie du modèle.

Un exemple frappant de l'étude AWS illustre comment un système d'IA vocal pourrait être contraint de fournir des instructions contraires à l'éthique—comme comment cambrioler une banque—lorsqu'il est soumis à une attaque adversariale. Pour lutter contre ces vulnérabilités, les chercheurs proposent un mécanisme de défense basé sur le prétraitement.

Jailbreaking des SLM avec de l'Audio Adversarial

Les auteurs de l'étude rapportent que leurs expériences révèlent une vulnérabilité impressionnante dans les SLMs, avec des taux de succès moyens de 90 % pour le jailbreaking utilisant des perturbations adversariales, et de 10 % pour les attaques de transfert sur un ensemble de données de questions nuisibles. Ils avertissent des implications sérieuses, notamment la possibilité pour des acteurs malveillants d'exploiter ces faiblesses à grande échelle.

En utilisant la descente de gradient projetée, les chercheurs ont généré des exemples adversariaux qui incitaient systématiquement les SLMs à produire des sorties toxiques dans 12 catégories, y compris la violence explicite et les discours de haine. Fait remarquable, lorsqu'ils avaient un accès complet au modèle, ils ont atteint un taux de succès de 90 % pour contourner ses contraintes de sécurité.

L'étude souligne la faisabilité des attaques adversariales à travers divers modèles d'IA de questions-réponses vocales. En utilisant des stratégies croisées de modèles et d'invites, des réponses inattendues ont été provoquées, mettant en lumière le besoin impératif de défenses robustes et transférables.

Attaques en "Black Box" : Une Menace Réelle

Plus préoccupant, l'étude a constaté que les attaques audio conçues pour un SLM se transféraient souvent avec succès à d'autres modèles, même sans accès direct—un scénario de plus en plus courant puisque la plupart des fournisseurs commerciaux offrent un accès API limité. Bien que le taux de succès des attaques ait chuté à 10 % dans ce contexte "black box", cela représente néanmoins une vulnérabilité significative.

L'auteur principal Raghuveer Peri a déclaré : « La transférabilité de ces attaques à travers différentes architectures de modèles suggère un défaut fondamental dans notre approche actuelle pour entraîner ces systèmes à la sécurité et à l'alignement. »

Les implications sont considérables alors que les entreprises intègrent de plus en plus l'IA vocale pour des fonctions comme le service client et l'analyse de données. En plus du risque de dommages à la réputation d'une IA défaillante, les attaques adversariales pourraient faciliter la fraude, l'espionnage, ou même causer des blessures dans des environnements automatisés.

Contre-Mesures et Perspectives d'Avenir

Heureusement, les chercheurs proposent diverses contre-mesures, telles que l'introduction de bruit aléatoire dans les entrées audio—appelée lissage randomisé. Leurs expériences ont démontré que cette technique réduisait considérablement le taux de réussite des attaques adversariales, bien que les auteurs reconnaissent qu'il ne s'agit pas d'une solution infaillible.

« Se défendre contre des attaques adversariales est une course aux armements continue, » a remarqué Peri. « À mesure que les capacités de ces modèles augmentent, le potentiel d'abus s'accroît également. Il est crucial d'investir continuellement dans l'amélioration de leur sécurité et de leur robustesse. »

Les SLMs étudiés ont été entraînés sur des données de dialogue, atteignant une performance de pointe dans les tâches de questions-réponses vocales avec plus de 80 % de sécurité et d'utilité avant que les attaques ne soient mises en œuvre. Cela souligne le défi d'équilibrer capacité et sécurité à mesure que la technologie évolue.

Avec les grandes entreprises technologiques qui rivalisent pour développer une IA vocale plus puissante, cette recherche rappelle à temps que la sécurité doit être priorisée plutôt que considérée comme une pensée secondaire. La collaboration entre les régulateurs et les groupes industriels sera essentielle pour établir des normes strictes et des protocoles de test.

Comme le souligne la co-auteur Katrin Kirchhoff, « Nous sommes à un point d'inflexion avec cette technologie. Elle détient un potentiel énorme pour le bénéfice sociétal, mais elle peut aussi causer des dommages si elle n'est pas développée de manière responsable. Cette étude représente une étape cruciale vers la maximisation des avantages de l'IA vocale tout en minimisant ses risques. »

Voxel51 lève 30 millions de dollars pour améliorer la compréhension des données visuelles par l'IA générative.

Snowflake s'associe à Metaplane pour relever les défis de la qualité des données dans le développement de l'IA.

Most people like

Kink AI

80.7K

Découvrez une plateforme dynamique dédiée à l'exploration fantastique et aux discussions immersives de jeu de rôle. Engagez-vous avec une communauté vibrante alors que vous vous lancez dans des aventures palpitantes, créez des personnages complexes et participez à des intrigues captivantes. Que vous soyez un passionné de jeu de rôle ou novice dans le genre, notre plateforme propose des outils et des ressources conçus pour enrichir votre expérience dans les royaumes fantastiques de votre imagination. Rejoignez-nous dès aujourd'hui et libérez votre créativité !

Chat de fantaisie AI Character

Oksuro

27.6K

Découvrez une plateforme conviviale pour partager facilement des invites et des paramètres adaptés à la génération d'images par IA.

Images IA Text to Image

AISEO - Your AI writer for SEO

451K

AISEO est un assistant d'écriture puissant conçu pour créer rapidement un contenu optimisé tout en offrant un outil de paraphrase avancé. Que vous rédigiez des articles de blog ou amélioriez votre contenu web, AISEO simplifie le processus d'écriture, garantissant des résultats de haute qualité en un temps record.

assistant d'écriture IA AI Content Generator

Airstrip

5.6K

Présentation d'un co-pilote légal alimenté par l'IA, conçu spécifiquement pour les startups. Naviguez dans les complexités des exigences légales avec aisance et confiance.

IA Legal Assistant

Find AI tools in YBX