Amazon améliore l'IA d'Alexa pour des conversations plus naturelles.

Amazon a dévoilé d'importantes améliorations des capacités de traitement du langage naturel et de parole d'Alexa, permettant à l'assistant virtuel d'interagir de manière plus humaine. Cette avancée, suggérée lors d'une présentation en mai, introduit un nouveau modèle de base conçu pour faciliter les conversations, les rendant plus organiques et intuitives.

Parmi les nouvelles fonctionnalités, Alexa peut désormais effectuer des appels API, améliorant ainsi l'accès à l'information et aux expériences personnalisées. La fiabilité des réponses factuelles d'Alexa a également été optimisée grâce à un meilleur ancrage des connaissances. De plus, Amazon a modernisé le système de reconnaissance automatique de la parole (ASR) d'Alexa, renforçant ses algorithmes et son matériel tout en adoptant un modèle de synthèse vocale plus vaste, formé sur des milliers d'heures de données audio multilingues. Ce système ASR avancé sait récupérer des interruptions grâce à une fonctionnalité qui répare la parole tronquée, permettant des échanges plus fluides.

En plus de ces mises à jour, Alexa a intégré un nouveau modèle de parole à parole qui ajoute des qualités conversationnelles humaines, notamment le rire et la capacité de refléter le ton émotionnel de l'utilisateur. Par exemple, si un utilisateur exprime de l'excitation, Alexa peut répondre de manière appropriée, enrichissant ainsi l'interaction avec une nuance émotionnelle.

Ces innovations ont été présentées par Dave Limp, vice-président senior d'Amazon, lors d'un événement au nouveau siège de l'entreprise à Arlington, en Virginie. Limp a souligné que les interactions avec Alexa sont désormais conçues pour donner l'impression de “parler à un autre être humain,” mettant en avant les avancées dans les capacités conversationnelles de l'assistant.

Une autre fonctionnalité remarquable permet aux utilisateurs d'activer Alexa simplement en regardant l'écran d'un appareil doté d'une caméra, éliminant ainsi le besoin d'un mot de réveil. Cette amélioration, souvent comparée aux dernières mises à jour de Siri d'Apple, utilise un nouveau traitement visuel sur l'appareil en conjonction avec des modèles acoustiques pour déterminer avec précision si l'utilisateur s'adresse à Alexa ou à une autre personne.

Le déploiement de ces capacités impressionnantes commencera dans les mois à venir et s'inscrit dans la vision du PDG Andy Jassy de créer “le meilleur assistant personnel au monde.” Pour soutenir cette mission, Amazon a constitué une équipe centrale dédiée aux projets ambitieux d'intelligence artificielle. Dirigée par Rohit Prasad, scientifique en chef d'Alexa et rendant directement compte à Jassy, cette équipe est prête à développer de grands modèles de langage qui élèveront encore les fonctionnalités et l'expérience utilisateur d'Alexa.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles