OpenAI hat mit der Einführung seiner fortschrittlichen Voice-Mode-Funktion begonnen, die ausgewählten zahlenden ChatGPT-Nutzern ermöglicht, natürlichere Gespräche mit dem AI-Chatbot zu führen. Bis Herbst 2023 wird erwartet, dass allen ChatGPT Plus-Mitgliedern dieser verbesserte Service zur Verfügung steht.
In einer Ankündigung auf X beschrieb OpenAI den fortschrittlichen Voice Mode als eine Funktion, die „natürlichere, in Echtzeit stattfindende Gespräche“ ermöglicht. Nutzer können nahtlos unterbrechen, während das System gleichzeitig ihre Emotionen erkennt und darauf reagiert.
Die Unterstützung für Sprachgespräche wurde im September eingeführt, und im Mai fand eine öffentliche Demo der verbesserten Version statt. Der neue ChatGPT-4o verwendet ein einziges multimodales Modell für Sprachinteraktionen, was die Kommunikation optimiert und die Latenz im Vergleich zur vorherigen Lösung, die auf drei separate Modelle angewiesen war, reduziert.
Allerdings wurde die erste Demo kritisiert, da die Sprachoption stark an die von Schauspielerin Scarlett Johansson erinnerte, die im Film „Her“ die AI-Figur Samantha sprach. Nach dem Rückschlag wurde die Veröffentlichung des fortschrittlichen Voice Modes verschoben, und OpenAI stellte klar, dass der Sprachschauspieler Johansson nicht absichtlich nachahmte. Folglich wurde die ähnlich klingende Stimme aus der Funktion entfernt.