Das Voice-AI-Startup ElevenLabs präsentiert ein neues Modell, das Eingaben in Songtexte verwandelt. Diese Strategie ähnelt der von Sam Altman bei der Einführung von OpenAIs Sora, einer KI zur Videoerstellung. Durch die Einbindung der Nutzer über soziale Medien will ElevenLabs Aufmerksamkeit für sein innovatives Produkt generieren.
Gegründet von ehemaligen Google- und Palantir-Mitarbeitern, ist ElevenLabs auf maschinelles Lernen (ML) für Sprachsynthese und -klonierung in mehreren Sprachen spezialisiert. Das Unternehmen bietet eine Reihe von Werkzeugen an, darunter eines zum Synchronisieren von Spielfilmen, und richtet seinen Fokus nun auf den Musikmarkt.
Stellen Sie sich die Möglichkeiten dieses KI-Modells vor: Ein sanftes Schlaflied für die Nacht, ein einprägsames Jingle für eine Werbekampagne oder ein fesselnder Musik-Intro für Ihren Podcast. Mit dem Aufstieg von AI-Musik-Startups wie Harmonai, Lyrical Labs, Suno AI und Loudly könnte ElevenLabs kurz davor sein, den nächsten großen Hit zu produzieren.
Darüber hinaus könnten Nutzer die Möglichkeit haben, diese KI-generierten Songs auf dem im Januar gestarteten Marktplatz von ElevenLabs zu verkaufen. Die Voice Library des Unternehmens ermöglicht es Nutzern, mit ihren KI-klonierten Stimmen Einnahmen zu erzielen, während sie die Kontrolle über deren Nutzung und Vergütung behalten.
Allerdings steht die KI-generierte Musik unter Beobachtung. Es gibt Bedenken hinsichtlich der Daten, die zum Trainieren des Modells verwendet wurden, und darüber, ob urheberrechtlich geschütztes Material einbezogen wurde. Falls geschützte Werke ohne Genehmigung verwendet wurden, könnte dies zu rechtlichen Auseinandersetzungen führen. Zudem besteht Besorgnis, dass solche Technologien das Einkommen traditioneller Künstler gefährden könnten, da KI den einzigartigen Stil eines Künstlers nachahmen und menschliche Musiker potenziell ersetzen könnte. Die Angst besteht darin, dass eine KI problemlos ein Weihnachtsalbum ohne Mitwirkung des Künstlers produzieren könnte, während das Risiko der Deepfake-Technologie eine zusätzliche Komplexität mit sich bringt.
Bisher hat ElevenLabs über ihre sozialen Medien hinaus keine weiteren Kommentare abgegeben. Obgleich die genaue maximale Länge der von der KI produzierten Songs unklar bleibt, deuten Beispiele, die vom Designchef des Unternehmens, Ammaar Reshi, geteilt wurden, darauf hin, dass die KI in der Lage ist, Texte für einen Standard-Song von drei Minuten zu generieren.