ElevenLabs, um pioneiro em tecnologia de voz AI conhecido por seus modelos de clonagem de voz, conversão de texto em fala e conversão de fala em fala, lançou uma nova ferramenta: o AI Voice Isolator. Agora disponível na plataforma ElevenLabs, essa inovação permite que criadores removam facilmente ruídos ambientes indesejados de diferentes tipos de conteúdo, incluindo filmes, podcasts e vídeos do YouTube.
Como Funciona o AI Voice Isolator?
Ruídos de fundo podem comprometer significativamente a qualidade das gravações. Os criadores frequentemente enfrentam desafios com sons como conversas, vento ou tráfego próximo, que podem ofuscar a voz do falante. Enquanto alguns utilizam microfones com cancelamento de ruído ambiental, essa opção pode não estar sempre disponível, especialmente para criadores em início de carreira.
O AI Voice Isolator da ElevenLabs atua na fase de pós-produção, permitindo que os usuários façam upload de seu conteúdo. Os modelos avançados analisam o arquivo, detectam e removem o ruído de fundo, extraindo um diálogo limpo. A ElevenLabs afirma que o AI Voice Isolator alcança uma qualidade de som comparável a gravações de estúdio. Uma demonstração do responsável pelo design da empresa, Ammaar Reshi, mostrou a eficácia da ferramenta ao eliminar o ruído distrativo de um soprador de folhas, resultando em fala cristalina.
Testes no Mundo Real
Para avaliar as capacidades do AI Voice Isolator, realizamos três testes. Gravamos três frases, cada uma interrompida por diferentes ruídos de fundo. A ferramenta processou o áudio em segundos, eliminando perturbações de portas se abrindo, batidas na mesa, aplausos e movimentos domésticos. Os únicos sons que teve dificuldade em filtrar foram o barulho de batidas na parede e estalos de dedos.
De acordo com Sam Sklar, líder de crescimento da ElevenLabs, a versão atual da ferramenta não suporta vocais de música; no entanto, os usuários podem ter sucesso com algumas faixas.
Melhorias Futuras
Embora a capacidade do Voice Isolator de lidar com ruídos de fundo irregulares o diferencie de outras ferramentas focadas em ruídos contínuos, ainda há espaço para aprimoramentos. A ElevenLabs busca melhorar continuamente seu desempenho. A empresa não divulgou muitos detalhes sobre os modelos por trás da ferramenta ou se as gravações enviadas serão usadas para treinamento. No entanto, os usuários podem optar por não compartilhar seus dados pessoais para essa finalidade através de um link em sua política de privacidade.
Atualmente, o Voice Isolator está disponível exclusivamente na plataforma ElevenLabs, com planos de abrir acesso à API nas próximas semanas, embora o cronograma exato ainda não tenha sido especificado. Os usuários podem acessar a ferramenta gratuitamente, embora com algumas limitações.
"O modelo Voice Isolator custa 1.000 caracteres por minuto de áudio. Oferecemos um plano gratuito que inclui 10.000 caracteres por mês, permitindo o processamento de 10 minutos de áudio sem custo", explicou Sklar. Para aqueles que buscam remover ruído de fundo de arquivos de áudio maiores, os planos pagos começam a partir de $5 por mês.