Revolutionäres KI-Modell wandelt Sprache in Text um – mit beeindruckend genauer Fachterminologie-Unterstützung für Ihr Unternehmen!

Die Fähigkeit, gesprochene Worte in Text umzuwandeln, wird oft unterschätzt, insbesondere durch die schnelle und präzise Leistung des neuen AdaKWS-Modells von aiOla, einem 2020 gegründeten israelischen Tech-Startup, das auf Spracherkennung spezialisiert ist.

AdaKWS verbessert OpenAI’s Whisper AI Spracherkennungssystem und steigert die Genauigkeit bei der Erkennung von Schlüsselwörtern um 6,2 % in 16 Sprachen und um über 16 % nur für Englisch. Mit einer bemerkenswerten Genauigkeit von 94,6 % übertrifft es Whisper's 88,4 % laut aiOla-Metriken. AdaKWS unterstützt die Transkription in nahezu Echtzeit in 100 Sprachen.

Obwohl diese Statistiken zunächst bescheiden erscheinen mögen, zeigen sie einen signifikanten Fortschritt von den 80. in den 90. Perzentil in der Genauigkeit. Dieses Upgrade bringt die Technologie von Nischenanwendungen zu breiteren Einsatzmöglichkeiten, selbst in stark regulierten Bereichen wie Gesundheitswesen und Lebensmittelsicherheit.

Wichtig ist auch, dass AdaKWS laut aiOla-Daten etwa 160 Mal schneller transkribiert als das Whisper-Large V2-Modell. „Die Fähigkeit, Schlüsselwörter zu erkennen, ermöglicht die Automatisierung alltäglicher Prozesse in verschiedenen Branchen, von der Meldung von Transportschäden bis zur Durchführung von Sicherheitsinspektionen in Lebensmittelbetrieben, und verwandelt Sprache in Handlung“, sagte Amir Haramaty, CEO und Mitbegründer von aiOla.

Vielfältige Unternehmensanwendungen

Es ist leicht, Spracherkennungstechnologie mit Aufgaben wie der Transkription von Kundendienstanrufen zu assoziieren, doch aiOla zeigt Fortschritte auch in weniger konventionellen Bereichen. In einer Medienvorführung demonstrierte Haramaty die Fähigkeit des Systems im Gesundheitswesen. Ein Redner im Gesundheitsbereich las Kennzahlen von Patientenüberwachungsgeräten vor, und das AdaKWS-Modell füllte innerhalb von Sekunden ein komplexes Textformular automatisch aus, wodurch manuelle Eingaben überflüssig wurden.

Darüber hinaus hebt aiOla die Anwendung zur Überwachung von Kühlschranktemperaturen in Supermärkten hervor. Indem menschliche Prüfer die Messwerte verbal übermitteln, spart das System dem Kunden jährlich über 110.000 Stunden, die sonst für manuelle Dateneingaben aufgewendet worden wären.

Das Potenzial von AdaKWS hat das Interesse von Branchenführern geweckt; Haramaty erwähnte einen Anruf von Oracle-CEO Larry Ellison, der Interesse daran zeigte, die Technologie für Gesundheitsakten anzuwenden.

So funktioniert AdaKWS Speech-to-Text

AdaKWS nutzt ein fortschrittliches Verfahren zur Schlüsselworterkennung, das sich nahtlos in Geschäftsabläufe integriert und Automatisierung durch Sprachbefehle ermöglicht. Es operiert als maschinelles Lernalgorithmus, das bestehende Modelle wie OpenAI’s Whisper verbessert, indem es sich zwischen dem Encoder des Modells—der für die Interpretation gesprochener Worte verantwortlich ist—und dem Decoder, der Audio in Text umwandelt, einfügt.

„Unser Fokus liegt auf der Optimierung“, erklärte Joseph Keshet, Chief Scientist von aiOla.

Im Gegensatz zu herkömmlichen Modellen, die umfangreiche Neutrainings für neue Schlüsselwörter benötigen, passt sich AdaKWS schnell an über 100 Sprachen und Dialekte an. Diese Anpassungsfähigkeit macht es ideal für Unternehmensumgebungen.

„Branchenspezifische Terminologie ist häufig und kann die Kommunikation dominieren“, bemerkte Haramaty. Keshet fügte hinzu: „Unser System ist so trainiert, dass es die Genauigkeit für diese Schlüsselwörter sichert, die in einem latenten Raum dargestellt sind, der effektiv über Sprachen generalisiert.“

AdaKWS ist besonders vorteilhaft für Organisationen, in denen mehrsprachige Interaktionen stattfinden, da es schnell an das spezifische Fachvokabular einer Branche angepasst werden kann. Nutzer können Schlüsselwortlisten einreichen, damit das Modell diese unabhängig erlernt und Begriffe selbst ohne vorherige Exposition gegenüber den gesprochenen Versionen erkennt.

Das Modell kann innerhalb weniger Stunden betriebsbereit sein und erlernt neue Sprachen, Prozesse und Schlüsselwörter schnell. Ein Benchmark-Test in 16 Sprachen zeigte, dass AdaKWS nicht nur die Genauigkeit von Whisper übertraf, sondern auch komplexe Begriffe effizient verwaltete und dabei weniger Rechenressourcen benötigte. Die zugrunde liegende Forschung wurde im September 2023 in einem wissenschaftlichen Artikel veröffentlicht.

Optimierung der Geschäftsabläufe

Während Unternehmen zunehmend effiziente und zuverlässige Lösungen für die Bewältigung komplexer Daten- und Kommunikationsaufgaben suchen, stellt aiOla’s AdaKWS eine bedeutende Gelegenheit dar, Abläufe zu optimieren und Overhead zu reduzieren. Die Technologie ist über Web- und mobile Anwendungen verfügbar und basiert auf einem Software-as-a-Service (SaaS) Abonnementmodell, das auf Nutzer und Anwendungsfall abgestimmt ist.

Die Fortschritte von aiOla im Bereich der Sprach-KI setzen neue Branchenmaßstäbe und ebnen den Weg für Innovationen, die die Integration von KI in die täglichen Geschäftsprozesse verbessern.

„Ich genieße Störungen, aber ich habe erkannt, dass die meisten Menschen es vorziehen, nicht gestört zu werden“, schloss Haramaty und betonte, dass AdaKWS darauf abzielt, bestehende Geschäftsabläufe zu ergänzen und zu verbessern, anstatt sie zu ersetzen.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles