OpenAI lanza un modelo de inteligencia artificial para clonación de voz, actualmente disponible solo para socios seleccionados.

Home Noticias de IA OpenAI lanza un modelo de inteligencia artificial para clonación de voz, actualmente disponible solo para socios seleccionados.

OpenAI está ampliando su alcance más allá de la generación de texto, imágenes y videos con un avance significativo en la tecnología de audio: la clonación de voz. Hoy, la empresa anunció su último modelo de IA, el “Voice Engine”. En desarrollo desde 2022, este modelo impulsa la API de texto a voz de OpenAI, además de las nuevas funcionalidades de Voz y Leer en Voz Alta de ChatGPT, presentadas a principios de este mes.

Cómo Funciona la Clonación de Voz

El Voice Engine puede crear clones de voz realistas al permitir que un hablante humano grabe un clip de audio de 15 segundos a través de un micrófono de teléfono o computadora. La IA luego genera un discurso natural que se asemeja al hablante original, permitiendo a los usuarios convertir cualquier texto escrito en palabras habladas.

Implicaciones para el Mercado de Audio Hablado

Esta tecnología tiene un enorme potencial para quienes hablan en público con frecuencia, incluidos podcasters, artistas de voz en off, narradores de audiolibros, gamers y representantes de servicio al cliente. Además, desafía a empresas competidoras en este ámbito, como ElevenLabs, Captions, Meta, WellSaid Labs y MyShell. OpenAI también destaca la capacidad del Voice Engine para ayudar a personas no verbales al proporcionar voces únicas y no robóticas, lo que puede ser fundamental en entornos terapéuticos y educativos para quienes tienen discapacidades del habla o desafíos de aprendizaje.

Casos de Uso Iniciales

En su anuncio, OpenAI mencionó que el Voice Engine está actualmente accesible a un pequeño grupo de socios de confianza, que incluyen:

- Age of Learning: Utiliza Voice Engine y GPT-4 para crear contenido de voz personalizado para diversas audiencias estudiantiles.

- HeyGen: Emplea la tecnología para la traducción de videos, creando avatares personalizados con voces multilingües realistas para mejorar la comunicación global.

- Dimagi: Integra Voice Engine para ofrecer retroalimentación interactiva y multilingüe a trabajadores de salud comunitaria, mejorando la prestación de servicios en áreas remotas.

- Livox: Mejora su aplicación de comunicación aumentativa y alternativa (AAC) con Voice Engine, proporcionando voces únicas para personas con discapacidades del habla y audición.

- Norman Prince Neurosciences Institute en Lifespan: Utiliza la tecnología para ayudar a pacientes con discapacidades del habla, notablemente restaurando la voz de un paciente con un tumor cerebral a partir de una muestra de audio previa.

OpenAI ha proporcionado muestras de audio que demuestran las capacidades de la tecnología, incluyendo una comparación entre la voz original de un paciente y la versión clonada utilizando el Voice Engine.

Acceso Limitado y Despliegue Cauteloso

Por ahora, el Voice Engine no está disponible para el público general. OpenAI comparte información y resultados de una previa a pequeña escala exclusivamente con sus socios de confianza. La empresa declaró: “Estamos adoptando un enfoque cauteloso e informado para una liberación más amplia debido al potencial de mal uso de la voz sintética”. OpenAI busca iniciar discusiones sobre el uso responsable de las voces sintéticas y evaluar cómo la sociedad puede adaptarse a estos avances.

El enfoque de OpenAI para lanzar el Voice Engine es coherente con los recientes llamados a regular la suplantación de voces por IA. Para asegurar un uso ético, los socios que prueban la tecnología deben cumplir con políticas estrictas que prohíben la suplantación no autorizada y requieren el consentimiento informado de los donantes de voz. Además, OpenAI está implementando medidas de seguridad, incluyendo marcas de agua y monitoreo proactivo, para promover un uso responsable de la tecnología.

¿Puede la IA Generativa Cerrar la Brecha de Recursos en Ciberseguridad?

Elon Musk presenta Grok-1.5: acercándose a los hitos de rendimiento de GPT-4.

Most people like

Jobtensor

76.2K

Descubre una innovadora bolsa de trabajo impulsada por IA, diseñada específicamente para carreras en TI, Ciencia e Ingeniería. Esta plataforma conecta sin esfuerzo a profesionales talentosos con los mejores empleadores, optimizando el proceso de búsqueda de empleo y maximizando las oportunidades en estos campos de alta demanda. Ya sea que busques tu próximo avance profesional o desees contratar al mejor talento, nuestros algoritmos inteligentes garantizan que encuentres la combinación perfecta más rápido que nunca.

Tablero de empleos de IA AI Recruiting

Xtransfer

173.5K

Mejorar los pagos de comercio global seguros es esencial en la economía interconectada de hoy. A medida que las empresas dependen cada vez más de transacciones internacionales, garantizar la seguridad y fiabilidad en los procesos de pago nunca ha sido tan crucial. Con las medidas adecuadas, las empresas pueden minimizar riesgos, optimizar operaciones y fomentar la confianza en el comercio transfronterizo. Priorizar soluciones de pago seguras no solo protege sus intereses financieros, sino que también allana el camino hacia un crecimiento sostenible en el mercado global.

Pago de comercio global Other

Vocca

Presentamos nuestro recepcionista de IA, diseñado específicamente para clínicas, que gestiona llamadas y reservas de manera experta todo el día, los 7 días de la semana. Mejore la eficiencia de su clínica y la experiencia del paciente con nuestra solución automatizada e inteligente que nunca descansa.

Recepcionista de IA AI Chatbot

CoCoClip AI

253.1K

En el vertiginoso panorama digital actual, los creadores de contenido en redes sociales necesitan herramientas eficientes para destacarse. Un editor de video con inteligencia artificial diseñado para ellos no solo agiliza el proceso de edición, sino que también potencia la creatividad. Esta tecnología innovadora simplifica la producción de videos, permitiendo a influencers y marcas crear contenido cautivador sin esfuerzo. Descubre cómo un editor de video con IA puede revolucionar tu estrategia en redes sociales, ahorrándote tiempo mientras mejora el engagement y el alcance.

Editor de video con IA AI Social Media Assistant

Find AI tools in YBX