In der vergangenen Woche präsentierte OpenAI GPT-4o mit einem menschenähnlicheren Sprachmodus. Beobachter stellten fest, dass eine der Stimmen von ChatGPT der Stimme von Scarlett Johansson ähnelt, insbesondere ihrer Rolle im Film „Her“. OpenAI erklärte, die Ähnlichkeit zwischen der flirtenden KI-Stimme namens Sky und Johansson sei unbeabsichtigt. Das Unternehmen kündigte an, die Verwendung von Sky vorübergehend auszusetzen, während Bedenken bezüglich der Stimme geklärt werden.
In einem Blogbeitrag stellte OpenAI klar: „Wir glauben, dass KI-Stimmen nicht absichtlich die einzigartige Stimme eines Prominenten nachahmen sollten. Sky’s Stimme ist keine Imitation von Scarlett Johansson, sondern stammt von einer anderen professionellen Schauspielerin, die ihre eigene natürliche Sprechstimme verwendet.“ Zudem betonten sie, dass sie aus Datenschutzgründen die Identitäten der Sprachkünstler nicht preisgeben können. Darüber hinaus stellte OpenAI hervor, dass jeder Darsteller mit „überdurchschnittlichen Marktsätzen“ entlohnt wird – eine Richtlinie, die gilt, solange ihre Stimmen in Produkten integriert sind.
Interessanterweise postete CEO Sam Altman kurz nach der Präsentation der verbesserten Sky-Stimme das Wort „her“. Das Unternehmen stellte jedoch entschieden klar, dass dies „keine Imitation“ sei.
Scarlett Johanssons Darstellung von Samantha in „Her“ ist eine der bekanntesten Darstellungen eines virtuellen Assistenten im Kino und liegt etwa ein Jahrzehnt vor dem Trend der conversational AI. Es ist daher wenig überraschend, dass ihre Leistung als Vorlage für moderne Sprachassistenten dient. Johansson hat zuvor rechtliche Schritte gegen einen Entwickler eingeleitet, der eine KI-generierte Version ihrer Stimme und ihres Abbilds ohne Genehmigung verwendet hat.
Derzeit sind die genauen Gründe für Sky's vorübergehende Rücknahme oder mögliche Änderungen vor ihrer Wiederherstellung unklar.