Découvrez les méthodes créatives avec lesquelles les utilisateurs exploitent le nouveau mode vocal de ChatGPT.

Home Actualités IA Découvrez les méthodes créatives avec lesquelles les utilisateurs exploitent le nouveau mode vocal de ChatGPT.

Updated on octobre 25 2024

Le mode vocal avancé de ChatGPT a été lancé mardi pour un groupe sélectionné d'abonnés OpenAI dans le cadre de sa très attendue version alpha. Annoncé initialement en mai, cette fonctionnalité révolutionne l'interaction en dépassant le dialogue textuel traditionnel pour engager les utilisateurs par le biais d'un langage parlé naturel, d'une qualité réaliste. Elle prend en charge une variété d'accents et de langues régionales. Selon OpenAI, Advanced Voice vise à offrir "des conversations plus naturelles en temps réel, permettant des interruptions à tout moment et détectant et répondant à vos émotions."

Cependant, le mode vocal présente certaines limitations. Le système fonctionne avec quatre voix prédéfinies et ne peut pas imiter les voix d'utilisateurs individuels ou de personnalités publiques. Les sons qui s'éloignent de ces préréglages sont automatiquement bloqués. De plus, Advanced Voice n'est pas conçu pour créer des audio protégés par des droits d'auteur ou produire de la musique. Il est intéressant de noter que les utilisateurs ont déjà expérimenté cette fonctionnalité en demandant à l'IA de beatboxer.

Le testeur alpha Ethan Sutin a partagé sur X (anciennement Twitter) un fil mettant en avant diverses réponses de l'Advanced Voice, y compris un court "rap d'anniversaire" et une démonstration de beatboxing. Les utilisateurs peuvent entendre la respiration numérique de l'IA entre les rythmes. Bien qu'elle ne puisse pas créer de chansons complètes, l'IA ajoute de manière impressionnante des effets sonores aux histoires de coucher, enrichissant l'expérience narrative. Par exemple, elle génère des bruits d'écrasement et de claquement lors d'un récit sur un cyborg rebelle, lorsqu'on lui demande de créer une atmosphère immersive.

Advanced Voice peut également générer spontanément des personnages réalistes, renforçant sa qualité lifelike. Les utilisateurs peuvent demander à l'IA de s'exprimer dans divers tons et langues, ajoutant de la profondeur à leurs interactions.

Les capacités vocales de l'IA vont au-delà des simples langues humaines. Par exemple, lorsqu'on lui demande, Advanced Voice peut imiter avec précision les sons de chat. Les utilisateurs peuvent interagir avec l’IA en posant des questions sur leurs compagnons félin, recevant des conseils et des astuces personnalisés en temps réel.

De plus, Advanced Voice peut utiliser la caméra de votre appareil pour soutenir les efforts de traduction. Dans un cas, un utilisateur a pointé son téléphone vers un jeu Pokémon GameBoy Advance en japonais, permettant à l'IA de lire le dialogue à l'écran pendant qu'il jouait. Bien que les fonctionnalités de partage vidéo et d'écran ne fassent pas partie de cette version alpha, OpenAI prévoit de les introduire prochainement. L'entreprise a l'intention d'élargir la version alpha à plus d'abonnés Plus dans les semaines à venir, avec un déploiement complet prévu pour cet automne.

Un Outil de Filtrage d’Eau Précis pour ChatGPT : Pourquoi OpenAI a Choisi de ne Pas le Publier

La prochaine fonctionnalité vocale avancée de ChatGPT devrait être lancée « la semaine prochaine ».

Most people like

API2D

17.8K

API2D est une API OpenAI puissante conçue pour se connecter facilement avec des applications tierces, permettant une variété de tâches d'IA telles que le traitement du langage naturel (NLP), l'apprentissage automatique (ML), la génération de conversations et la traduction linguistique. Cet outil polyvalent améliore les capacités des développeurs et des entreprises cherchant à intégrer des fonctionnalités d'IA avancées.

API AI Tools Directory

Ghostwriter Add-ins for Microsoft Office

21K

Transformez votre expérience Microsoft Office avec des solutions IA révolutionnaires Libérez tout le potentiel de Microsoft Office grâce à des innovations IA novatrices conçues pour améliorer votre productivité et rationaliser votre flux de travail. Découvrez comment ces outils avancés peuvent révolutionner votre façon de créer, de collaborer et de communiquer au sein de vos applications Office préférées. Que vous souhaitiez automatiser des tâches fastidieuses ou améliorer la création de vos documents, nos solutions IA sont ici pour redéfinir votre expérience Microsoft Office.

Bureau Large Language Models (LLMs)

TopMediai

1.1M

Découvrez la puissance des outils de médias en ligne propulsés par l'IA, conçus pour améliorer vos contenus vidéo, audio et photo. Ces solutions innovantes utilisent l'intelligence artificielle pour simplifier la production, améliorer la qualité et stimuler la créativité, facilitant ainsi l'engagement de votre audience comme jamais auparavant.

Outils d'IA AI Audio Enhancer

Imagga Image Recognition API

36.7K

Déverrouillez le potentiel de la technologie avancée de reconnaissance d'images avec notre API puissante, conçue pour un marquage efficace, une catégorisation fluide et une reconnaissance faciale précise. Que vous souhaitiez améliorer vos applications ou optimiser votre flux de traitement d'images, notre API vous fournit les outils nécessaires pour rehausser l'expérience utilisateur et améliorer l'efficacité organisationnelle. Transformez la gestion de votre contenu visuel avec des solutions à la pointe de la technologie, adaptées à vos besoins uniques.

Étiquetage d'images AI Image Recognition

Find AI tools in YBX