La prochaine fonctionnalité vocale avancée de ChatGPT devrait être lancée « la semaine prochaine ».

OpenAI a récemment annoncé sur X (anciennement Twitter) que sa très attendue fonctionnalité Avancée de Voix pour ChatGPT sera lancée "la semaine prochaine", d'abord pour un groupe restreint d'abonnés ChatGPT Plus. Ce test alpha vise à recueillir les retours des utilisateurs avant d'étendre la fonctionnalité en fonction de leurs commentaires.

La Voix Avancée transforme l'interaction en permettant des conversations naturelles sans dépendre de messages textuels, semblable à une discussion entre deux personnes. Présentée pour la première fois en mai lors du lancement de GPT-4o à l'événement Printemps de l'entreprise, cette fonctionnalité se distingue des assistants numériques classiques comme Siri et Google Assistant. Contrairement à ces systèmes, souvent limités à des réponses scriptées, la Voix Avancée de ChatGPT offre des réponses quasi instantanées, presque humaines, dans plusieurs langues. Le modèle GPT-4o affiche un temps de réponse audio moyen de seulement 320 millisecondes, comparable à la vitesse de conversation humaine. Dans la vidéo de démonstration, les spectateurs peuvent observer comment le modèle interagit avec plusieurs utilisateurs, improvise des discussions en anglais et en portugais, et témoigne d'émotions humaines, y compris le rire.

Les critères de sélection des participants au test alpha ne sont pas encore clairs, bien qu'ils doivent être abonnés à ChatGPT Plus à 20 $/mois. Prévu pour une sortie en juin, le lancement alpha avait été retardé pour améliorer les capacités de modération de contenu et renforcer l'infrastructure informatique afin de répondre à la demande prévue. Comme annoncé en juin, le déploiement complet de la Voix Avancée n'est pas attendu avant cet automne, et sa date dépendra de la garantie que la fonctionnalité respecte des normes de sécurité et de fiabilité élevées.

L'intégration de capacités de conversation naturelle dans ChatGPT constitue une avancée majeure. Cette évolution réduit la nécessité d'une fenêtre contextuelle, allégeant les exigences matérielles et élargissant les applications potentielles de l'IA, en particulier pour les utilisateurs rencontrant des défis de mobilité ou de dextérité. De plus, en simplifiant les interactions, cette fonctionnalité favorise une acceptation plus large de la technologie AI parmi les utilisateurs qui, bien qu'habitués à des commandes vocales comme "hey Siri", peuvent trouver la conception de requêtes intimidante.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles