Gladia, un proveedor de transcripción e inteligencia de audio impulsado por IA con sede en París, Francia, ha conseguido recaudar con éxito 16 millones de dólares en financiamiento. La empresa planea utilizar esta inversión para mejorar su infraestructura de audio, comenzando por un innovador motor de transcripción y análisis de audio en tiempo real. Esta tecnología tiene como objetivo potenciar plataformas de voz prioritarias con capacidades avanzadas de IA para ofrecer experiencias de usuario superiores en diversas regiones.
En una entrevista, el CEO Jean-Louis Quéguiner explicó la motivación detrás de la fundación de Gladia, resaltando sus propios desafíos con los servicios de transcripción existentes mientras conversaba en inglés con un acento francés marcado. "Como pueden escuchar mi hermoso acento francés," explicó Quéguiner, "estaba extremadamente frustrado con las inexactitudes que estos servicios producían consistentemente."
Quéguiner demostró las capacidades de transcripción en tiempo real de Gladia, mostrando su impresionante precisión incluso con su fuerte acento. Durante la demostración, el sistema cambió de idioma sin esfuerzo, ilustrando su competencia multilingüe.
La ronda de financiamiento fue liderada por XAnge, con la participación de inversores notables como Illuminate Financial, XTX Ventures, Athletico Ventures, Gaingels, Mana Ventures, Motier Ventures, Roosh Ventures, y Soma Capital. Esta ronda reciente lleva la financiación total de Gladia a 20.3 millones de dólares, tras inversiones iniciales de firmas como New Wave, Sequoia Capital, Cocoa y GFC. Además, la compañía ha sido seleccionada para participar en el programa AWS Generative AI Accelerator.
Según Alexis du Peloux, socio de XAnge, "Gladia encarna las cualidades que promovemos: un equipo tecnológico audaz y global a la vanguardia de la innovación en IA, con un modelo de negocio comprobado capaz de desbloquear nuevas oportunidades en diversas industrias." Elogió a Quéguiner y su equipo por su efectiva ejecución en un panorama de IA de rápido movimiento.
Gladia se distingue por priorizar el desarrollo de un producto verdaderamente multilingüe, abordando los sesgos inherentes a la mayoría de los modelos de reconocimiento de voz, que a menudo son entrenados principalmente con datos en inglés. El nuevo motor permite la transcripción en tiempo real en más de 100 idiomas, apoyando acentos de manera efectiva y adaptándose a cambios de idioma al instante.
Lo que hace a Gladia especialmente innovadora es su capacidad para extraer información procesable de las llamadas, como análisis de sentimientos, información clave y resúmenes, todo generado en menos de un segundo.
Construir un motor multilingüe en tiempo real y de baja latencia es un desafío complejo que requiere amplios conocimientos lingüísticos y habilidades de procesamiento de datos. Sin embargo, el producto de Gladia mitiga estos desafíos. Su motor de conversión de voz a texto logra una latencia líder en la industria de menos de 300 milisegundos, manteniendo una alta precisión, independientemente del idioma o del entorno técnico.
"Muchas empresas están invirtiendo un tiempo y recursos significativos para integrar funciones de IA en sus plataformas existentes," comentó Jonathan Soto, CTO de Gladia. "Nuestra API única es compatible con todos los tech stacks, incluidos SIP, VoIP, FreeSwitch y Asterisk, facilitando la integración de la transcripción en tiempo real en las plataformas de IA de nuestros clientes."
Desde el lanzamiento de su API de transcripción asíncrona e inteligencia de audio en junio de 2023, Gladia ha ganado una notable tracción en el sector empresarial, especialmente entre soluciones de grabación de reuniones y toma de notas. La API ha atraído a más de 600 clientes globales, incluyendo empresas como Attention, Circleback, Method Financial, Recall, Sana y VEED.IO, y cuenta con más de 70,000 usuarios.
"La tecnología de Gladia empodera a las empresas en sectores que requieren transcripción avanzada en tiempo real, permitiéndoles pasar de un procesamiento manual posterior a las llamadas a flujos de trabajo proactivos de baja latencia," afirmó Quéguiner. "Nuestras soluciones apoyan la enriquecimiento automatizado de CRM y brindan asistencia en tiempo real para agentes de soporte, mejorando la eficiencia operativa sin requerir una amplia experiencia interna en IA."
Con la nueva financiación, Gladia busca acelerar sus esfuerzos de I+D, introduciendo un conjunto completo de herramientas de IA para audio, junto con modelos adicionales a la carta, como modelos de lenguaje grande (LLMs) y generación aumentada por recuperación (RAG). La compañía está actualmente pilotando una solución de asistencia para agentes dentro del sector CCaaS (contact-center-as-a-service) y planea expandir su equipo en preparación para el crecimiento internacional.
Quéguiner destacó la capacidad única de Gladia para realizar "cambio de código," permitiendo a los usuarios iniciar la transcripción en un idioma y transitar sin problemas a otro durante una llamada. Subrayó la importancia del procesamiento en tiempo real y la capacidad de integrar vocabularios personalizados, afirmando: "Nuestro modelo ofrece información en tiempo real que nos distingue de la competencia."
En cuanto a oportunidades de mercado, Quéguiner señaló el enfoque de Gladia en grabadoras de reuniones y su colaboración con centros de contacto, que mejoran la velocidad de finalización de llamadas hasta en un 30% gracias a la mayor precisión. Gladia operará bajo una estructura de precios sencilla, cobrando generalmente una tarifa plana basada en el uso horario.
En resumen, Gladia se sitúa en la intersección de la innovación en IA y la transcripción en tiempo real, lista para transformar la manera en que las empresas interactúan con la inteligencia audio en diversos entornos.