Assembly AI stellt das Universal-1 Modell vor, das 30 % weniger Halluzinationen im Vergleich zu Whisper aufweist.

Home KI-Nachrichten Assembly AI stellt das Universal-1 Modell vor, das 30 % weniger Halluzinationen im Vergleich zu Whisper aufweist.

Der AI-as-a-Service-Anbieter Assembly AI hat sein neuestes Spracherkennungsmodell, Universal-1, vorgestellt. Trainiert mit über 12,5 Millionen Stunden mehrsprachiger Audiodaten erreicht Universal-1 eine beeindruckende Sprach-zu-Text-Genauigkeit in Englisch, Spanisch, Französisch und Deutsch. Das Unternehmen behauptet, dass Universal-1 Halluzinationen bei Sprachdaten um 30 % und bei Umgebungsgeräuschen um 90 % im Vergleich zum Whisper Large-v3 Modell von OpenAI reduziert.

In einem kürzlichen Blogbeitrag beschrieb Assembly AI Universal-1 als einen bedeutenden Fortschritt auf dem Weg, präzise, zuverlässige und robuste Sprach-zu-Text-Funktionen in mehreren Sprachen zu bieten. Das Modell kann erfolgreich zwischen verschiedenen Sprachen wechseln und transkribiert mehrere Sprachen innerhalb einer einzigen Audiodatei.

Universal-1 überzeugt mit verbesserter Zeitstempelschätzung, die für die Audiobearbeitung sowie die Analyse von Gesprächen entscheidend ist. Es übertrifft seinen Vorgänger Conformer-2 um 13 % und bietet eine bessere Sprecherdiarisierung sowie eine verbesserte concatenated minimum-permutation word error rate (cpWER) von 14 %. Darüber hinaus hat die Genauigkeit der Sprecheranzahl auf 71 % zugenommen.

Das Modell verfügt zudem über optimierte parallele Inferenz, was die Verarbeitungszeit langer Audiodateien erheblich reduziert. Universal-1 transkribiert eine Stunde Audio in nur 21 Sekunden auf Nvidia Tesla T4-Maschinen, was fünfmal schneller ist als Whisper Large-v3, das für dieselbe Aufgabe 107 Sekunden bei einer kleineren Batchgröße benötigt.

Verbesserte Sprach-zu-Text-AI-Modelle bieten zahlreiche Vorteile, darunter die Erstellung genauerer und zuverlässigerer Notizen, die Identifizierung von Aktionspunkten sowie die Sortierung von Metadaten wie Eigennamen, Sprecheridentifizierung und Zeitstempel. Diese Verbesserungen werden verschiedene Anwendungen unterstützen, von KI-gestützter Videobearbeitung bis hin zu Telemedizin-Plattformen, die präzise Einträge klinischer Notizen und die Übermittlung von Ansprüchen erfordern.

Das Universal-1-Modell ist nun über die API von Assembly AI zugänglich.

Perplexitys Wachstumsherausforderungen: SEO-Bedenken und Schwächen von Googles Dominanz aufdecken

Metas Bilderzeuger hat Schwierigkeiten, mehrfarbige Paare und Freundschaften darzustellen.

Most people like

SEOpital

16.7K

In der heutigen digitalen Landschaft ist die Erstellung hochwertiger Inhalte entscheidend für die Verbesserung Ihrer Online-Sichtbarkeit. Mit dem Aufkommen von Suchmaschinen-Algorithmen, die relevante und wertvolle Informationen priorisieren, kann ein SEO-AI-Schreibassistent Ihre geheime Waffe sein. Dieses Tool optimiert nicht nur den Schreibprozess, sondern sorgt auch dafür, dass Ihre Inhalte höher in den Suchergebnissen eingestuft werden. Egal, ob Sie ein erfahrener Schriftsteller oder neu in der Inhaltserstellung sind, die Nutzung von KI-Technologie kann zu beeindruckenden Verbesserungen bei der Publikumsbindung und Reichweite führen. Entdecken Sie, wie ein SEO-AI-Schreibassistent Ihre Content-Strategie verbessern und organischen Traffic auf Ihre Seite lenken kann.

SEO KI-Schreibassistent AI SEO Assistant

Perchance AI

11.6M

Entdecken Sie eine innovative Plattform, die es ermöglicht, mühelos Zufallsgeneratoren zu erstellen. Dieses vielseitige Werkzeug erlaubt es Nutzern, maßgeschneiderte Generatoren für eine Vielzahl von Anwendungen zu entwerfen, von Spielen und Entscheidungsfindung bis hin zu Brainstorming und kreativem Geschichtenerzählen. Egal, ob Sie Entwickler, Pädagoge oder kreativer Enthusiast sind, diese Plattform befähigt Sie, originelle Lösungen zur Randomisierung zu entwickeln, die fesseln und inspirieren. Entfalten Sie noch heute Ihre Kreativität mit der ultimativen Plattform zur Erstellung von Zufallsgeneratoren!

Zufallsgenerator AI Tutorial

SciSpace

5.4M

SciSpace ist ein innovatives KI-Tool, das Nutzern hilft, wissenschaftliche Forschungsarbeiten besser zu verstehen und zu bewerten. Ob als Student, Forscher oder Fachkraft – SciSpace verwandelt komplexe Informationen in zugängliche Einblicke und erleichtert damit das Navigieren in der Welt der akademischen Literatur.

KI-gestütztes Werkzeug Papers

15minuteplan.ai

79.7K

Erstellen Sie Ihren KI-Geschäftsplan in nur 15 Minuten Einen soliden Geschäftsplan zu erstellen, muss keine herausfordernde Aufgabe sein. Mit unserem KI-Geschäftsplan-Generator können Sie in nur 15 Minuten mühelos einen umfassenden und maßgeschneiderten Geschäftsplan entwickeln. Egal, ob Sie ein Startup gründen oder Investitionen suchen, unser intuitives Tool führt Sie durch jeden Schritt und sorgt dafür, dass Ihr Plan heraussticht und den Branchenstandards entspricht. Verabschieden Sie sich von Schreibblockaden und begrüßen Sie einen klaren Fahrplan für Ihren Geschäftserfolg!

KI AI Content Generator

Find AI tools in YBX