ElevenLabs Introduce Funciones de Narración por Voz para Tu Sitio Web

La función "haga clic aquí para escuchar este artículo" en algunas páginas web es invaluable para personas con discapacidades visuales y dificultades de lectura, así como para aquellos que tienen poco tiempo. Esta semana, ElevenLabs, una innovadora startup de inteligencia artificial de voz, lanzó Audio Native, un reproductor de audio que narra automáticamente el contenido de las páginas web utilizando su avanzada tecnología de conversión de texto a voz.

Además, ElevenLabs presentó ElevenLabs Reader, que ofrece narración en 11 voces diferentes tanto para páginas web como para documentos. Sus modelos de voz soportan 29 idiomas y cuentan con la capacidad de doblar películas completas y convertir mensajes en letras de canciones. Audio Native está disponible en el nivel "creator" por $11 al mes e incluye métricas integradas y un panel de control para monitorear la participación de la audiencia. En su página de X (anteriormente Twitter), ElevenLabs mostró ejemplos de sitios web que utilizan su tecnología, como su blog, una guía de IA para SEO de bensbites.com y un artículo de noviembre de 2023 en The New Yorker titulado “No todas las amenazas a la seguridad nacional de Estados Unidos están en el extranjero.” Medios establecidos como The Atlantic y The New York Times también han adoptado la tecnología de ElevenLabs. "Es personalizable, fácil de configurar, y mejora la participación del lector al hacer tu contenido más accesible a audiencias en todo el mundo," afirmó Sam Sklar de ElevenLabs en una entrada de blog.

Integrando Audio en Sitios Web

Con Audio Native, los usuarios pueden integrar fácilmente audio en su sitio web o añadir voz a proyectos existentes utilizando la API de ElevenLabs. Para ello, deben proporcionar un breve fragmento de HTML, agregar su dominio a la lista de "permitidos", seleccionar una voz entre las opciones disponibles y personalizar el color de fondo y texto del reproductor antes de copiar y pegar el código en su sitio. Un diccionario de pronunciación opcional permite incluir frases específicas de la marca. Por defecto, el modelo genera narraciones para todo el texto en una página, pero se puede personalizar utilizando selectores CSS. Actualmente, la herramienta es compatible con plataformas como React, Squarespace, WordPress, Ghost, Webflow y Framer. Las reseñas iniciales describen la herramienta como "increíble" y subrayan su gran potencial para mejorar la accesibilidad.

Innovaciones Futuras en el Horizonte

Basándose en las respuestas en redes sociales, ElevenLabs parece comprometido a expandir sus funciones. Cuando un usuario sugirió agregar capacidades de RSS para podcasting de su contenido escrito, Luke Harries, jefe de crecimiento de ElevenLabs, respondió: “Gran idea, compartiré con el equipo.” Fundada en 2022 por el exingeniero de Google Piotr Dabkowski y el estratega de Palantir Mati Staniszewski, ElevenLabs ha alcanzado rápidamente una valoración de $1.1 mil millones, asegurando $80 millones en su más reciente ronda de financiación en enero.

En un panorama competitivo con actores como Speechify, Deepgram y Voicemod, ElevenLabs está posicionada de manera única en el creciente mercado global de clonación de voz por IA, que se proyecta alcanzará los $16.2 mil millones para 2032, con una tasa de crecimiento anual compuesta (CAGR) de casi el 28% desde 2023. ElevenLabs también ha colaborado con HarperCollins Publishers para crear audiolibros generados por IA y lanzó un mercado para que los usuarios monetizen sus voces clonadas. Sin embargo, la empresa enfrenta escrutinio respecto a sus capacidades de generación musical y preocupaciones sobre el uso de materiales con derechos de autor en la formación de sus modelos, un tema que ha recibido atención creciente recientemente.

Most people like

Find AI tools in YBX