WellSaid Labs présente 'HINTS' : une révolution dans les standards de personnalisation de la voix IA.

WellSaid Labs, leader dans la technologie vocale d'intelligence artificielle (IA), a lancé un outil innovant qui permet aux utilisateurs de diriger les performances vocales de l'IA avec une plus grande naturalité et nuance. Cette nouvelle fonctionnalité, appelée HINTS (Discours Naturel Intuitif et Personnalisé), permet aux créateurs de contenu de personnaliser les voix de l'IA à l'aide d'annotations contextuelles, telles que des ajustements de tempo et de volume, à l'image du travail d'un réalisateur.

Michael Petrochuk, cofondateur et CTO de WellSaid Labs, a déclaré lors d'une interview exclusive : « Nos clients ont exprimé un besoin de contrôle accru sur les sorties vocales de notre IA. Nous avons voulu créer un système à la fois intuitif et naturel, permettant à notre modèle de prédire des performances authentiques en fonction du contexte utilisateur, afin que les créatifs puissent réaliser leur vision artistique. »

HINTS représente une avancée par rapport aux méthodes traditionnelles reposant sur des langages de balisage rigides ou des prompts basiques pour contrôler les voix de l'IA. Cette nouvelle technologie permet des ajustements détaillés et interpolables, comme ralentir un passage spécifique de 0,7x ou augmenter le volume de 5 dB, tout en permettant à la voix d'IA de répondre de manière fluide. Sa conscience contextuelle permet aux utilisateurs de superposer et de imbriquer des annotations sur des scripts étendus.

« Le système utilise des données humaines réelles (obtenues avec consentement) pour ses sorties audio, rendant ses verbalizations annotées aussi réalistes que celles sans annotations, » a expliqué Petrochuk. « Fait remarquable, nous avons constaté que le modèle exploite efficacement un unique ensemble de données mais peut également généraliser les performances de plusieurs locuteurs pour améliorer sa prosodie. Cette découverte a dépassé nos attentes et souligne le potentiel de recherche future. »

HINTS répond à la demande d'outils vocaux d'IA hautement personnalisables et axés sur le directeur, transformant potentiellement le contenu vocal pour les livres audio, les modules de formation, les vidéos marketing et plus encore. Les premières évaluations indiquent des améliorations en termes de précision et de naturalité.

La recherche met également l'accent sur des pratiques d'IA responsables et éthiques. « Depuis le début, nous sommes engagés dans une innovation éthique, » a noté Petrochuk. WellSaid garantit un consentement explicite de la part des contributeurs vocaux, protège la vie privée et modère le contenu pour éviter tout abus.

Alors que l'IA vocale s'intègre de plus en plus dans les technologies de consommation et le divertissement, HINTS illustre comment cette technologie peut servir de moyen empathique de narration, plutôt que de simple outil vocal. Bien que des limitations demeurent par rapport au talent humain, des innovations comme HINTS nous rapprochent d'une véritable voix synthétique expressive.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles