Días después de presentar el avatar mejorado de ChatGPT, capaz de ofrecer respuestas en tiempo real y con características humanas, OpenAI ha decidido suspender la tan comentada función de voz "Sky". Esta decisión responde a preocupaciones de que la voz Sky se asemejara demasiado a la actuación de Scarlett Johansson como el personaje de inteligencia artificial en la película "Her". OpenAI ha negado que la voz sea una imitación directa, aclarando que es la “voz natural de una actriz profesional diferente”.
Actualmente, no se sabe cuándo o si la voz Sky será reinstalada. Sin embargo, los usuarios de ChatGPT aún pueden elegir entre cuatro opciones de voz alternativas: Breeze, Cove, Ember y Juniper.
Tras este anuncio, el periodista Yashar Ali compartió una declaración del representante de Johansson, confirmando que Johansson fue contactada por el CEO de OpenAI, Sam Altman, antes del lanzamiento de la nueva voz, pero rechazó la oferta. Johansson expresó su sorpresa y frustración al escuchar la demostración, señalando que la voz era alarmantemente similar a la suya, lo que llevó a confusiones entre amigos y medios de comunicación.
OpenAI lanzó las funciones de voz para ChatGPT en septiembre de 2023, pero el modelo inicial mostró una latencia notable debido a su dependencia de tres sistemas distintos: uno para transcribir audio a texto, GPT-3.5/GPT-4 para generar respuestas, y otro para convertir el texto de nuevo a audio. Como resultado, la inteligencia artificial tuvo dificultad para reaccionar adecuadamente al tono, múltiples hablantes y ruidos de fondo.
Para abordar estas limitaciones, OpenAI anunció recientemente GPT-4o, una inteligencia artificial multimodal unificada en tiempo real que integra texto, voz y visión, ofreciendo respuestas en aproximadamente 320 milisegundos. Esta actualización posiciona a ChatGPT como un competidor potencial de asistentes de voz establecidos como Siri y Alexa.
Después del lanzamiento, los usuarios notaron rápidamente que la voz Sky se asemejaba notablemente al personaje de inteligencia artificial “Samantha” de "Her", lo que generó especulaciones sobre si OpenAI había utilizado IA para replicar las características vocales de Johansson. En respuesta a estas preocupaciones, OpenAI suspendió la voz Sky, clarificando que no es una imitación de Johansson, sino la voz de una actriz profesional seleccionada tras un extenso proceso de reclutamiento de cinco meses. “Creemos que las voces de IA no deberían imitar deliberadamente la voz distintiva de una celebridad”, afirmó OpenAI en un blog. Resaltaron que las voces, elegidas entre un grupo de 400 solicitantes, fueron seleccionadas de acuerdo con criterios de diversidad, atemporalidad y calidez.
Mientras se suspenda la voz Sky, las otras cuatro opciones de voz siguen disponibles. Con el próximo lanzamiento del nuevo Modo de Voz de GPT-4o, los usuarios pueden explorar estas alternativas mientras interactúan con la IA. En cuanto al futuro de la voz Sky, sigue siendo incierto qué ajustes planea implementar OpenAI para abordar las preocupaciones sobre sus similitudes con el personaje de Johansson. La empresa se compromete a colaborar con los actores de voz involucrados y planea ampliar su oferta con más opciones de voz para satisfacer las diversas preferencias e intereses de los usuarios.