ElevenLabs, pionnier de la technologie vocale AI réputé pour ses solutions de clonage vocal, de synthèse vocale et de conversion de la parole, a lancé un nouvel outil : l’AI Voice Isolator. Disponible sur la plateforme ElevenLabs, cette innovation permet aux créateurs d'éliminer facilement les bruits ambiants indésirables de divers contenus, tels que des films, des podcasts et des vidéos YouTube.
Comment fonctionne l’AI Voice Isolator ?
Les bruits de fond peuvent nuire considérablement à la qualité des enregistrements. Les créateurs sont souvent confrontés à des nuisances telles que le bavardage, le vent ou les bruits de la circulation, qui peuvent masquer la voix du locuteur. Bien que certains utilisent des microphones avec annulation active du bruit, cette option n’est pas toujours accessible, surtout pour les créateurs en début de parcours.
C'est là qu'intervient l’AI Voice Isolator d’ElevenLabs. Cet outil fonctionne en phase de post-production, permettant aux utilisateurs de télécharger leur contenu. Ses modèles avancés analysent le fichier, détectent et éliminent le bruit de fond, extrayant ainsi un dialogue clair. ElevenLabs assure que l’AI Voice Isolator atteint une qualité sonore comparable à celle des enregistrements studios. Une démonstration réalisée par Ammaar Reshi, directeur du design de l’entreprise, a illustré son efficacité en supprimant le bruit distrayant d'un souffleur de feuilles, obtenant ainsi un discours limpide.
Tests en conditions réelles
Pour évaluer les capacités de l’AI Voice Isolator, nous avons réalisé trois tests. Nous avons d'abord enregistré trois phrases, chacune interrompue par divers bruits de fond. L’outil a traité l’audio en quelques secondes, éliminant les perturbations causées par des portes qui s’ouvrent, des coups sur la table, des applaudissements, et des mouvements domestiques. Les seuls sons qu'il a eu du mal à filtrer étaient les coups sur les murs et les claquements de doigts.
Sam Sklar, responsable de la croissance chez ElevenLabs, a précisé que la version actuelle de l’outil ne prend pas en charge les voix musicales ; cependant, les utilisateurs peuvent réussir avec certaines pistes.
Améliorations futures
Bien que la capacité du Voice Isolator à gérer des bruits irréguliers le distingue des autres outils axés sur les bruits constants, des améliorations restent possibles. ElevenLabs s'engage à améliorer continuellement ses performances.
L’entreprise n’a pas divulgué d'informations détaillées sur les modèles derrière l’outil ou si les enregistrements téléchargés seront utilisés pour l’entraînement. Toutefois, les utilisateurs peuvent choisir de ne pas avoir leur donnée personnelle utilisée à cette fin via un lien dans la politique de confidentialité.
Actuellement, l’AI Voice Isolator est disponible exclusivement sur la plateforme ElevenLabs, avec des projets d'ouverture de l'accès API dans les semaines à venir, bien qu'aucun calendrier précis ne soit spécifié. Les utilisateurs peuvent accéder à l’outil gratuitement, bien que des limitations soient en place.
"Le modèle Voice Isolator coûte 1 000 caractères par minute d’audio. Nous proposons un plan gratuit qui inclut 10 000 caractères par mois, permettant de traiter 10 minutes d’audio sans frais", a expliqué Sklar. Pour ceux souhaitant supprimer les bruits de fond d’enregistrements audio plus volumineux, les forfaits payants commencent à 5 $ par mois.