OpenAI stellt KI-Modell zur Sprachklonung vor – derzeit nur für ausgewählte Partner verfügbar.

Home KI-Nachrichten OpenAI stellt KI-Modell zur Sprachklonung vor – derzeit nur für ausgewählte Partner verfügbar.

OpenAI erweitert seine Reichweite über die Text-, Bild- und Videogenerierung hinaus mit einem bedeutenden Fortschritt in der Audiotechnologie: der Sprachklonung. Heute gab das Unternehmen sein neuestes KI-Modell, den „Voice Engine“, bekannt. Dieses Modell wurde seit 2022 entwickelt und treibt die Text-zu-Sprache-API von OpenAI sowie die neuen Funktionen ChatGPT Voice und Read Aloud an, die Anfang dieses Monats eingeführt wurden.

Funktionsweise der Sprachklonung

Der Voice Engine kann realistische Sprachklone erstellen, indem eine Person einen 15-sekündigen Audioausschnitt über ein Telefon- oder Computer-Mikrofon aufnimmt. Die KI generiert dann natürlich klingende Sprache, die der Stimme des Originalsprechers ähnlich ist, sodass Nutzer eingegebenen Text in gesprochene Worte umwandeln können.

Wesentliche Auswirkungen auf den Markt für gesprochene Audioinhalte

Diese Technologie birgt enormes Potenzial für Personen, die häufig öffentlich sprechen, darunter Podcaster, Synchronsprecher, Hörbuchsprecher, Gamer und Kundenservicemitarbeiter. Darüber hinaus stellt sie eine Herausforderung für Wettbewerber in diesem Bereich dar, wie ElevenLabs, Captions, Meta, WellSaid Labs und MyShell. OpenAI hebt zudem hervor, dass der Voice Engine nonverbalen Personen mit einzigartigen, nicht-robotischen Stimmen unterstützen kann, was in therapeutischen und Bildungsumgebungen für Menschen mit Sprachbehinderungen oder Lernschwierigkeiten von großer Bedeutung sein kann.

Erste Anwendungsfälle

In seiner Ankündigung stellte OpenAI fest, dass der Voice Engine derzeit einer kleinen Gruppe von vertrauenswürdigen Partnern zugänglich ist, darunter:

- Age of Learning: Nutzt Voice Engine und GPT-4 zur Erstellung personalisierter Sprachinhalte für verschiedene Schülergruppen.

- HeyGen: Setzt die Technologie zur Videotranslation ein und erstellt benutzerdefinierte Avatare mit realistisch klingenden mehrsprachigen Stimmen zur Verbesserung der globalen Kommunikation.

- Dimagi: Integriert Voice Engine, um interaktive, mehrsprachige Rückmeldungen für Community-Gesundheitsarbeiter bereitzustellen und die Dienstleistungsqualität in entlegenen Gebieten zu verbessern.

- Livox: Verbessert seine AAC-App mit Voice Engine, um einzigartigen Stimmen für Personen mit Sprach- und Hörbehinderungen zu bieten.

- Norman Prince Neurosciences Institute at Lifespan: Nutzt die Technologie, um Patienten mit Sprachbehinderungen zu unterstützen, einschließlich der Wiederherstellung der Stimme eines Hirntumorpatienten basierend auf einer früheren Audioaufnahme.

OpenAI hat Audio-Beispiele bereitgestellt, die die Fähigkeiten der Technologie demonstrieren, einschließlich eines Vergleichs zwischen der Originalstimme eines Patienten und der geklonten Version mit dem Voice Engine.

Eingeschränkter Zugang und vorsichtige Einführung

Derzeit ist der Voice Engine nicht für die breite Öffentlichkeit verfügbar. OpenAI teilt Erkenntnisse und Ergebnisse aus einer kleinen Vorschau ausschließlich mit seinen vertrauenswürdigen Partnern. Das Unternehmen erklärte: „Wir verfolgen einen vorsichtigen und informierten Ansatz für eine breitere Veröffentlichung, um das Potenzial für den Missbrauch synthetischer Stimmen zu berücksichtigen.“ OpenAI möchte Diskussionen über die verantwortungsvolle Nutzung synthetischer Stimmen anstoßen und bewerten, wie die Gesellschaft sich an diese Fortschritte anpassen kann.

Der Ansatz von OpenAI zur Veröffentlichung des Voice Engine entspricht den jüngsten Forderungen nach Regulierung der KI-Stimmenimitation. Um eine ethische Nutzung sicherzustellen, müssen Partner, die die Technologie testen, strenge Richtlinien einhalten, die unautorisierte Imitationen untersagen und die informierte Zustimmung der Stimmegeber erfordern. Darüber hinaus führt OpenAI Sicherheitsmaßnahmen wie Wasserzeichen und proaktive Überwachung ein, um eine verantwortungsvolle Nutzung der Technologie zu fördern.

Kann Generative KI die Ressourcenlücke in der Cybersicherheit schließen?

Elon Musk präsentiert Grok-1.5: Nahe an den Leistungsmeilensteinen von GPT-4

Most people like

Clearscope

108.2K

Verbessern Sie Ihre digitale Präsenz mit unserer KI-gesteuerten SEO-Content-Optimierungsplattform, die darauf ausgelegt ist, die Sichtbarkeit und Interaktion Ihrer Website zu steigern. Maximieren Sie das Potenzial Ihrer Inhalte mit intelligenten Erkenntnissen und maßgeschneiderten Empfehlungen, damit Sie in der wettbewerbsintensiven Online-Welt stets einen Schritt voraus sind. Nutzen Sie modernste Technologie für effektive SEO-Strategien und beobachten Sie, wie Ihr Verkehr in die Höhe schnellt!

SEO AI SEO Assistant

ContentBot - AI Content Automation and Workflows

88K

ContentBot ist ein hochmodernes KI-Tool, das entwickelt wurde, um die Inhaltserstellung für Vermarkter zu revolutionieren, indem es den gesamten Prozess automatisiert und optimiert. Diese innovative Lösung unterstützt Fachleute dabei, Zeit zu sparen und ihre Produktivität zu steigern, während sie effizient hochwertige, ansprechende Inhalte erstellen.

KI-Inhaltautomatisierung AI Content Generator

Kua.ai

35.7K

Ecommerce-Erfolg durch KI-gestützte Inhaltsgenerierung entfesseln Im heutigen wettbewerbsintensiven Online-Markt kann die Nutzung von KI-Inhaltsgenerierung Ihre Ecommerce-Strategie erheblich verbessern. Durch die Automatisierung und Optimierung Ihrer Inhaltsproduktion können Sie Kunden effektiver ansprechen, die Suchmaschinenranking verbessern und letztendlich den Umsatz steigern. Erfahren Sie, wie Sie die Kraft der künstlichen Intelligenz nutzen können, um Ihr Ecommerce-Geschäft auf neue Höhen zu heben.

KI-Inhaltserstellung AI Content Generator

Free AI Content Detector

336.8K

Entfalten Sie die Kraft der Erkenntnisse mit unserem kostenlosen KI-Textanalysetool. Entdecken Sie, wie diese innovative Software Ihnen hilft, Ihren Text mühelos zu untersuchen, zu interpretieren und zu optimieren, um bessere Ergebnisse zu erzielen. Egal, ob Sie Student, Berufstätiger oder Forscher sind, unser Tool vereinfacht den Prozess der Textanalyse und macht ihn für alle zugänglich und benutzerfreundlich. Beginnen Sie noch heute mit der Transformation Ihrer schriftlichen Inhalte!

AI-Inhaltsdetektor AI Content Detector

Find AI tools in YBX