Synthesia Avanza en Tecnología de Video AI con Nuevos 'Avatares Expresivos' para una Mayor Interacción

La startup londinense Synthesia, especializada en la creación de videos con inteligencia artificial para empresas, ha mejorado su plataforma con la introducción de "avatares expresivos". A partir de hoy, estos avatares impulsados por IA elevan las capacidades de los avatares digitales tradicionales, ajustando su tono, expresiones faciales y lenguaje corporal según el contexto del contenido. Este lanzamiento sigue a la reciente presentación de Microsoft de VASA, un marco de IA que transforma retratos humanos en videos animados que hablan y cantan con expresiones y movimientos de cabeza. Sin embargo, a diferencia de VASA, que sigue siendo un proyecto de investigación, los avatares expresivos de Synthesia ofrecen tecnología real diseñada para ayudar a las empresas a crear videos de IA más realistas para su audiencia.

El Salto Innovador de Synthesia en Videos de IA

Fundada en 2017 por investigadores y emprendedores de IA de Stanford y Cambridge, Synthesia ha desarrollado una plataforma integral que combina voces y avatares de IA personalizados. Los usuarios pueden crear videos de IA de calidad de estudio utilizando guiones preescritos o contenido generado por IA, lo que ha llevado a una adopción significativa en las empresas. Más de 200,000 usuarios han creado más de 18 millones de videos, aunque los avatares anteriores carecían de la capacidad de transmitir sentimientos de manera efectiva, ya que no podían modificar su tono o expresiones en tiempo real según el guion. Con el lanzamiento de avatares expresivos, esta limitación se aborda.

Según Synthesia, los nuevos avatares de IA pueden comprender el sentimiento y el contexto dentro del texto, ajustando su tono y expresiones en consecuencia. Pueden transmitir una variedad de emociones a través de cambios sutiles en las expresiones, parpadeos y movimientos oculares. Por ejemplo, un avatar podría sonreír al tratar un tema alegre o ralentizar su discurso con pausas más largas para contenidos más sombrios. “Nuestro objetivo no es solo crear renders digitales, sino introducir actores digitales”, declaró Jon Starck, CTO de Synthesia, en una entrada de blog. “Esta tecnología mejora el realismo de los avatares digitales, difuminando la línea entre lo virtual y lo real”.

Fundamento Técnico de los Avatares Expresivos

Para lograr esta comprensión matizada del sentimiento, Synthesia emplea EXPRESS-1, un modelo de aprendizaje profundo entrenado en extensos datos de texto y video que reflejan la comunicación hablada en el mundo real. “EXPRESS-1 predice movimientos y expresiones faciales en tiempo real, alineándose perfectamente con los matices y énfasis del habla, lo que resulta en actuaciones extraordinariamente naturales”, explicó Starck. Los nuevos avatares también presentan capacidades mejoradas de sincronización de labios y voz en múltiples idiomas.

Implicaciones de los Avatares Expresivos

Si bien los avatares de IA con emociones humanizadas presentan riesgos potenciales de uso indebido, Synthesia está comprometida a fomentar aplicaciones empresariales positivas, especialmente en comunicación y compartición de conocimientos. Por ejemplo, las empresas de atención médica podrían utilizar avatares expresivos para producir videos de pacientes más empáticos, mientras que los equipos de marketing podrían transmitir entusiasmo por un nuevo producto.

Para promover un uso responsable, Synthesia ha revisado sus políticas para restringir ciertos tipos de contenido en su plataforma y está invirtiendo activamente en la detección temprana de abusos y tecnologías de verificación de contenido como C2PA. Actualmente, con una plantilla de 300 empleados, Synthesia colabora con más de 55,000 empresas, incluyendo la mitad de las Fortune 100. Entre sus clientes se encuentra Zoom, que reporta un aumento del 90% en eficiencia para la creación de videos de ventas y capacitación utilizando Synthesia.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles