Gladia, ein KI-gestützter Anbieter von Transkriptions- und Audiointelligenz mit Sitz in Paris, hat erfolgreich 16 Millionen Dollar an Finanzierung gesichert. Das Unternehmen plant, diese Investition zu nutzen, um seine Audioinfrastruktur auszubauen, beginnend mit einer innovativen Echtzeit-Transkriptions- und Analyse-Engine. Diese Technologie soll sprachbasierten Plattformen fortschrittliche KI-Funktionen bieten, um herausragende Nutzererlebnisse in verschiedenen Regionen zu gewährleisten.
In einem Interview erläuterte CEO Jean-Louis Quéguiner die Motivation zur Gründung von Gladia und verwies auf seine eigenen Herausforderungen mit bestehenden Transkriptionsdiensten bei der Verwendung von Englisch mit starkem französischen Akzent. "Wie Sie an meinem schönen französischen Akzent hören können," erklärte Quéguiner, "war ich extrem frustriert über die ständig erzeugten Ungenauigkeiten dieser Dienste."
Quéguiner demonstrierte die Echtzeit-Transkriptionsfähigkeiten von Gladia und zeigte dabei die beeindruckende Genauigkeit, selbst mit seinem starken Akzent. Während der Demonstration wechselte das System nahtlos zwischen den Sprachen und veranschaulichte seine mehrsprachige Kompetenz.
Die Finanzierungsrunde wurde von XAnge geleitet, mit Beteiligung namhafter Investoren wie Illuminate Financial, XTX Ventures, Athletico Ventures, Gaingels, Mana Ventures, Motier Ventures, Roosh Ventures und Soma Capital. Diese Runde erhöht Gladias Gesamtfinanzierung auf 20,3 Millionen Dollar, nachdem zuvor Seed-Investitionen von Firmen wie New Wave, Sequoia Capital, Cocoa und GFC erfolgt waren. Das Unternehmen wurde außerdem für die Teilnahme am AWS Generative AI Accelerator-Programm ausgewählt.
Laut Alexis du Peloux, Partner bei XAnge, verkörpert "Gladia die Qualitäten, die wir fördern: ein mutiges, globales Technikteam an der Spitze der KI-Innovation mit einem bew proven Geschäftsmodell, das neue Chancen in verschiedenen Branchen eröffnet." Er lobte Quéguiner und sein Team für die effektive Umsetzung in einer schnelllebigen KI-Landschaft.
Gladia unterscheidet sich durch die Priorisierung der Entwicklung eines wirklich mehrsprachigen Produkts, wodurch inhärente Vorurteile in den meisten Spracherkennungsmodellen angesprochen werden, die häufig hauptsächlich auf englischen Daten trainiert sind. Die neue Engine ermöglicht Echtzeit-Transkription in über 100 Sprachen, unterstützt Akzente effektiv und kann sprachliche Wechsel in Echtzeit bewältigen.
Besonders innovativ ist Gladias Fähigkeit, aus Anrufen umsetzbare Erkenntnisse zu extrahieren, wie beispielsweise Stimmungsanalysen, wichtige Informationen und Zusammenfassungen, die in weniger als einer Sekunde generiert werden.
Der Aufbau einer Echtzeit-, latenzarmen, mehrsprachigen Engine ist eine komplexe Aufgabe, die umfangreiche Sprachverständnis- und Datenverarbeitungsfähigkeiten erfordert. Doch Gladias Produkt mindert diese Herausforderungen. Die Spracherkennungsengine erreicht eine branchenführende Latenz von unter 300 Millisekunden und bleibt dabei in allen Sprachen und technischen Umgebungen hochgenau.
"Viele Unternehmen investieren erhebliche Zeit und Ressourcen, um verschiedene KI-Funktionen in ihre bestehenden Plattformen zu integrieren," bemerkte Jonathan Soto, CTO von Gladia. "Unsere einheitliche API ist mit allen Technologie-Stacks kompatibel, einschließlich SIP, VoIP, FreeSwitch und Asterisk, wodurch die Integration von Echtzeit-Transkription in die KI-Plattformen der Kunden erleichtert wird."
Seit der Einführung seiner ersten asynchronen Transkriptions- und Audiointelligenz-API im Juni 2023 hat Gladia im Unternehmenssektor, insbesondere bei Lösungen für die Aufzeichnung von Besprechungen und das Notieren, erheblich an Fahrt gewonnen. Die API hat über 600 globale Kunden gewonnen, darunter Unternehmen wie Attention, Circleback, Method Financial, Recall, Sana und VEED.IO, und zählt mehr als 70.000 Nutzer.
"Die Technologie von Gladia ermöglicht es Unternehmen in Sektoren, die fortschrittliche Echtzeit-Transkription benötigen, von manueller Nachbearbeitung nach Anrufen zu proaktiven, latenzarmen Arbeitsabläufen überzugehen," erklärte Quéguiner. "Unsere Lösungen unterstützen die automatisierte CRM-Anreicherung und bieten Echtzeithilfe für Supportmitarbeiter, wodurch die betriebliche Effizienz verbessert wird, ohne umfangreiche interne KI-Expertise zu erfordern."
Mit der neuen Finanzierung will Gladia seine F&E-Bemühungen beschleunigen und ein umfassendes KI-Toolkit für Audio sowie zusätzliche à-la-carte-Modelle wie große Sprachmodelle (LLMs) und retrieval-augmented generation (RAG) einführen. Das Unternehmen testet derzeit eine agentenunterstützende Lösung im Bereich Contact-Center-as-a-Service (CCaaS) und plant, seinen Talentpool zur Vorbereitung auf internationales Wachstum zu erweitern.
Quéguiner hob Gladias einzigartige Fähigkeit hervor, "Code-Switching" durchzuführen, was es den Nutzern ermöglicht, die Transkription in einer Sprache zu starten und während eines Anrufs nahtlos zu einer anderen zu wechseln. Er betonte die Bedeutung der Echtzeitverarbeitung und die Möglichkeit, benutzerdefinierte Vokabulare zu integrieren, und behauptete: "Unser Modell bietet Echtzeiteinblicke, die uns von Wettbewerbern abheben."
Im Bereich der Marktchancen wies Quéguiner auf Gladias Fokus auf Besprechungsrekorder und die Zusammenarbeit mit Contact Centern hin, die die Abschlussgeschwindigkeit von Anrufen um bis zu 30% aufgrund verbesserter Genauigkeit erhöhen. Gladia wird auf einer klaren Preisstruktur basieren, die in der Regel einen Festpreis basierend auf der stündlichen Nutzung berechnet.
Insgesamt steht Gladia an der Schnittstelle von KI-Innovation und Echtzeit-Transkription und ist bereit, die Art und Weise zu revolutionieren, wie Unternehmen in unterschiedlichen Umgebungen mit Audiointelligenz interagieren.