Gladia, fournisseur parisien d'intelligence audio et de transcription alimenté par l'IA, a réussi à lever 16 millions de dollars. Cette levée de fonds permettra à l'entreprise de renforcer son infrastructure audio, en commençant par un moteur innovant de transcription et d'analyse audio en temps réel. Cette technologie vise à doter les plateformes axées sur la voix de capacités avancées en IA, améliorant ainsi l'expérience utilisateur à travers différentes régions.
Lors d'un entretien, le PDG Jean-Louis Quéguiner a expliqué sa motivation à fonder Gladia, évoquant ses propres frustrations avec les services de transcription existants, notamment en parlant anglais avec un accent français prononcé. "Comme vous pouvez l'entendre avec mon magnifique accent français," a déclaré Quéguiner, "j'étais extrêmement frustré par les inexactitudes persistantes de ces services."
Quéguiner a démontré les capacités de transcription en temps réel de Gladia, montrant une précision impressionnante même avec son accent prononcé. Lors de la démonstration, le système a parfaitement alterné entre les langues, illustrant sa compétence multilingue.
Ce tour de financement a été dirigé par XAnge, avec la participation d'investisseurs notables tels qu'Illuminate Financial, XTX Ventures, Athletico Ventures, Gaingels, Mana Ventures, Motier Ventures, Roosh Ventures et Soma Capital. Cette récente levée porte le financement total de Gladia à 20,3 millions de dollars, après des investissements initiaux de firmes comme New Wave, Sequoia Capital, Cocoa et GFC. L'entreprise a également été sélectionnée pour participer au programme AWS Generative AI Accelerator.
Selon Alexis du Peloux, partenaire chez XAnge, "Gladia incarne les qualités que nous soutenons : une équipe technologique audacieuse et mondiale à la pointe de l'innovation en IA, avec un modèle économique éprouvé capable d'ouvrir de nouvelles opportunités dans divers secteurs." Il a félicité Quéguiner et son équipe pour leur exécution efficace dans un paysage AI en rapide évolution.
Gladia se distingue en priorisant le développement d'un produit vraiment multilingue, résolvant ainsi les biais inhérents à la plupart des modèles de reconnaissance vocale, souvent entraînés principalement sur des données anglaises. Le nouveau moteur permet une transcription en temps réel dans plus de 100 langues, gère efficacement les accents et s'adapte au changement de langue en un clin d'œil.
L'innovation majeure de Gladia réside dans sa capacité à extraire des informations exploitables des appels, telles que l'analyse des sentiments, des informations clés et des résumés, le tout généré en moins d'une seconde.
Créer un moteur multilingue en temps réel et à faible latence est un défi complexe, nécessitant une compréhension approfondie des langues et des compétences en traitement des données. Cependant, le produit de Gladia atténue ces défis. Son moteur de transcription vocale atteint une latence de moins de 300 millisecondes tout en maintenant une grande précision, quel que soit la langue ou l'environnement technique.
"De nombreuses entreprises investissent beaucoup de temps et de ressources pour intégrer diverses fonctions d'IA dans leurs plateformes existantes," a remarqué Jonathan Soto, CTO de Gladia. "Notre API unique est compatible avec tous les environnements techniques, y compris SIP, VoIP, FreeSwitch et Asterisk, facilitant l'intégration de la transcription en temps réel dans les plateformes d'IA de leurs clients."
Depuis le lancement de sa première API de transcription asynchrone et d'intelligence audio en juin 2023, Gladia a gagné une traction significative dans le secteur des entreprises, notamment parmi les solutions d'enregistrement de réunions et de prise de notes. L'API a attiré plus de 600 clients dans le monde entier, dont des entreprises comme Attention, Circleback, Method Financial, Recall, Sana et VEED.IO, avec plus de 70 000 utilisateurs.
"La technologie de Gladia permet aux entreprises de secteurs nécessitant une transcription avancée en temps réel de passer des processus manuels post-appel à des flux de travail proactifs et à faible latence," a déclaré Quéguiner. "Nos solutions soutiennent l'enrichissement automatisé des CRM et offrent une assistance en temps réel aux agents de support, améliorant ainsi l'efficacité opérationnelle sans nécessiter d'expertise interne approfondie en IA."
Avec ce nouveau financement, Gladia vise à accélérer ses efforts de R&D, en introduisant une boîte à outils complète d'IA pour l'audio, ainsi que des modèles à la carte tels que les grands modèles de langue (LLMs) et la génération augmentée par récupération (RAG). L'entreprise pilote actuellement une solution d'assistance aux agents dans le secteur du contact-center-as-a-service (CCaaS) et prévoit d'élargir son équipe en préparation à une croissance internationale.
Quéguiner a souligné la capacité unique de Gladia à effectuer du "code switching," permettant aux utilisateurs de commencer une transcription dans une langue et de passer harmonieusement à une autre durant un appel. Il a souligné l'importance du traitement en temps réel et la capacité d'intégrer des vocabulaires personnalisés, affirmant : "Notre modèle offre des informations en temps réel qui nous distinguent de nos concurrents."
En termes d'opportunités de marché, Quéguiner a noté l'accent mis par Gladia sur les enregistreurs de réunions et sa collaboration avec les centres de contact, qui améliorent la vitesse de finalisation des appels jusqu'à 30 % grâce à une précision accrue. Gladia adoptera une structure tarifaire simple, facturant généralement un tarif fixe basé sur l'utilisation horaire.
Dans l'ensemble, Gladia se positionne à l'intersection de l'innovation en IA et de la transcription en temps réel, prête à transformer la manière dont les entreprises interagissent avec l'intelligence audio dans divers contextes.