A WellSaid Labs, líder em tecnologia de voz artificial (IA), lançou uma ferramenta inovadora que permite aos usuários dirigir performances de voz da IA com maior naturalidade e nuances. Esse novo recurso, denominado HINTS (Discurso Altamente Intuitivo e Naturalmente Personalizado), capacita criadores de conteúdo a personalizar vozes de IA utilizando anotações contextuais, como ajustes de tempo e volume, de forma semelhante ao trabalho de um diretor de cinema.
Michael Petrochuk, co-fundador e CTO da WellSaid Labs, compartilhou em uma entrevista exclusiva: “Nossos clientes expressaram o desejo de ter mais controle sobre as saídas vocais da nossa IA. Nosso objetivo foi criar um sistema que seja tanto intuitivo quanto natural, permitindo que nosso modelo preveja performances autênticas com base no contexto do usuário, para que os criativos possam realizar sua visão artística.”
O HINTS representa uma mudança em relação aos métodos tradicionais que dependem de linguagens de marcação rígidas ou comandos básicos para controlar as vozes da IA. Essa nova tecnologia permite ajustes detalhados e interpoláveis—como alterar uma passagem específica para ser 0,7x mais lenta ou aumentar o volume em 5 dB—enquanto a voz da IA responde de forma contínua. Sua consciência contextual permite que os usuários sobreponham e aninhem anotações em roteiros extensos.
“O sistema utiliza dados humanos reais (obtidos com consentimento) para suas saídas de áudio, tornando suas verbalizações anotadas tão realistas quanto aquelas sem anotações,” explicou Petrochuk. “Remarkavelmente, descobrimos que o modelo não só utiliza efetivamente um único conjunto de dados, mas também consegue generalizar performances de múltiplos oradores para aprimorar sua prosódia. Essa descoberta superou nossas expectativas e destaca o potencial para pesquisas futuras.”
O HINTS atende à demanda por ferramentas de voz de IA altamente personalizáveis e voltadas para diretores, podendo transformar conteúdos baseados em voz para audiobooks, módulos de treinamento, vídeos de marketing e mais. Avaliações iniciais indicam melhorias em precisão e naturalidade.
A pesquisa também prioriza práticas de IA responsáveis e éticas. “Desde o início, temos nos comprometido com inovações éticas,” observou Petrochuk. A WellSaid garante o consentimento explícito dos colaboradores de voz, protege a privacidade e modera o conteúdo para evitar abusos.
À medida que a IA vocal se torna cada vez mais integrada às tecnologias de consumo e ao entretenimento, o HINTS exemplifica como essa tecnologia pode servir como um meio de contar histórias empáticas, e não apenas como uma ferramenta vocal. Embora ainda existam limitações em comparação ao talento humano, inovações como o HINTS nos aproximam de vozes sintéticas verdadeiramente expressivas.