ElevenLabs, pionero en tecnología de voz AI conocido por su clonación de voces y modelos de texto a voz y de voz a voz, ha lanzado una nueva herramienta: el AI Voice Isolator. Ahora disponible en la plataforma ElevenLabs, esta innovadora herramienta permite a los creadores eliminar sin esfuerzo ruidos ambientales no deseados de varios tipos de contenido, como películas, podcasts y videos de YouTube.
¿Cómo Funciona el AI Voice Isolator?
El ruido de fondo puede comprometer significativamente la calidad de las grabaciones. Los creadores a menudo enfrentan desafíos con sonidos como charlas, viento o tráfico cercano, que pueden opacar la voz del hablante. Aunque algunos utilizan micrófonos con cancelación de ruido ambiental, esta opción puede no estar siempre disponible, especialmente para creadores en etapas iniciales.
Aquí es donde entra el AI Voice Isolator de ElevenLabs. Esta herramienta funciona en la fase de postproducción, permitiendo a los usuarios subir su contenido. Los modelos avanzados analizan el archivo, detectan y eliminan el ruido de fondo, extrayendo así diálogos claros. ElevenLabs asegura que el AI Voice Isolator logra una calidad de sonido comparable a la de grabaciones de estudio. Un demo realizado por Ammaar Reshi, director de diseño de la compañía, mostró su efectividad al eliminar el ruido distrayente de una sopladora de hojas, resultando en un discurso nítido.
Pruebas en el Mundo Real
Para evaluar las capacidades del AI Voice Isolator, realizamos tres pruebas. Primero, grabamos tres frases, cada una interrumpida por diversos ruidos de fondo. La herramienta procesó el audio en segundos, eliminando molestias de apertura de puertas, golpes en mesas, aplausos y movimientos en el hogar. Los únicos sonidos que le costó filtrar fueron los golpes en la pared y los chasquidos de dedos.
Según Sam Sklar, líder de crecimiento de ElevenLabs, la versión actual de la herramienta no admite voces musicales; sin embargo, los usuarios podrían tener éxito con algunas pistas.
Mejoras Futuras
Aunque la capacidad del Voice Isolator para manejar ruidos de fondo irregulares lo distingue de otras herramientas que se centran en ruidos constantes, aún hay margen de mejora. ElevenLabs tiene como objetivo seguir perfeccionando su rendimiento. La compañía no ha revelado mucho sobre los modelos detrás de la herramienta ni si las grabaciones subidas se utilizarán para entrenamiento. No obstante, los usuarios pueden optar por no permitir el uso de sus datos personales a través de un enlace en su política de privacidad.
Actualmente, el Voice Isolator está disponible exclusivamente en la plataforma ElevenLabs, con planes de abrir acceso a API en las próximas semanas, aunque la fecha exacta no ha sido especificada. Los usuarios pueden acceder a la herramienta de forma gratuita, aunque con limitaciones. "El modelo Voice Isolator cuesta 1,000 caracteres por minuto de audio. Ofrecemos un plan gratuito que incluye 10,000 caracteres al mes, lo que permite procesar 10 minutos de audio sin costo," explicó Sklar. Para aquellos que busquen eliminar ruido de fondo de archivos de audio más grandes, los planes de pago comienzan en $5 al mes.