ElevenLabs, ein Vorreiter in der KI-Sprachtechnologie, bekannt für seine Sprachklon-, Text-in-Sprache- und Sprach-in-Sprache-Modelle, hat ein neues Tool eingeführt: den AI Voice Isolator. Dieser innovative Dienst auf der ElevenLabs-Plattform ermöglicht es Kreativen, unerwünschte Umgebungsgeräusche aus verschiedenen Inhalten wie Filmen, Podcasts und YouTube-Videos mühelos zu entfernen.
Funktionsweise des AI Voice Isolators
Hintergrundgeräusche können die Qualität von Aufnahmen erheblich beeinträchtigen. Kreative stehen häufig vor Herausforderungen durch Geräusche wie Gespräche, Wind oder Verkehr, die die Stimme des Sprechers überdecken können. Während einige Mikrofone mit Umgebungslärmunterdrückung ausgestattet sind, ist diese Option nicht immer für aufstrebende Schöpfer zugänglich.
Hier kommt der AI Voice Isolator von ElevenLabs ins Spiel. Dieses Tool funktioniert in der Postproduktion und ermöglicht es den Nutzern, ihre Inhalte hochzuladen. Die fortschrittlichen Modelle analysieren die Datei, erkennen und entfernen Hintergrundgeräusche und extrahieren schließlich den klaren Dialog. ElevenLabs behauptet, dass der AI Voice Isolator eine Klangqualität erreicht, die mit Studioproduktionen vergleichbar ist. Eine Demo des Head of Design von ElevenLabs, Ammaar Reshi, zeigte die Wirksamkeit des Tools, indem es die störenden Geräusche eines Laubbläsers entfernte und zu glasklarer Sprache führte.
Praxis-Test
Um die Fähigkeiten des AI Voice Isolators zu bewerten, haben wir drei Tests durchgeführt. Zuerst haben wir drei Sätze aufgenommen, die jeweils von verschiedenen Hintergrundgeräuschen unterbrochen wurden. Das Tool verarbeitete die Audioaufnahmen in wenigen Sekunden und beseitigte Störungen durch Türöffnungen, Geschirrgeklapper, Klatschen und Bewegungen im Haushalt. Die einzigen Geräusche, die es nicht erfolgreich filtern konnte, waren das Klopfen an der Wand und das Fingerschnippen.
Laut Sam Sklar, dem Wachstumsleiter von ElevenLabs, unterstützt die aktuelle Version des Tools keine Musikvokale; jedoch könnten Nutzer mit einigen Tracks Erfolge erzielen.
Zukünftige Verbesserungen
Obwohl die Fähigkeit des Voice Isolators, unregelmäßige Hintergrundgeräusche zu verarbeiten, ihn von anderen Tools unterscheidet, gibt es noch Verbesserungsbedarf. ElevenLabs strebt eine kontinuierliche Leistungsoptimierung an.
Das Unternehmen hat nicht viel über die Modelle hinter dem Tool verraten oder darüber, ob hochgeladene Aufnahmen für das Training verwendet werden. Nutzer können jedoch über einen Link in der Datenschutzerklärung auf die Nutzung ihrer persönlichen Daten für Trainingszwecke verzichten.
Derzeit ist der Voice Isolator exklusiv auf der ElevenLabs-Plattform verfügbar, wobei in den kommenden Wochen eine API-Zugriffsöffnung geplant ist, obwohl der genaue Zeitrahmen noch nicht festgelegt wurde. Nutzer können das Tool kostenlos nutzen, jedoch mit bestimmten Einschränkungen.
„Das Voice Isolator-Modell kostet 1.000 Zeichen pro Minute Audio. Wir bieten einen kostenlosen Plan an, der 10.000 Zeichen pro Monat umfasst, was die Verarbeitung von 10 Minuten Audio kostenlos ermöglicht“, erklärte Sklar. Für diejenigen, die Hintergrundgeräusche aus größeren Audiodateien entfernen möchten, beginnen die kostenpflichtigen Pläne bei 5 USD pro Monat.