El Modo de Voz Avanzado es una función innovadora de ChatGPT que permite a los usuarios interactuar en tiempo real de manera conversacional con el chatbot de IA, eliminando la necesidad de mensajes de texto o intercambios de audio prolongados. Lanzada a finales de julio para un grupo selecto de suscriptores Plus, esta característica fue presentada por primera vez en el evento de Actualización de Primavera de OpenAI.
OpenAI describe el Modo de Voz Avanzado como una herramienta que ofrece “conversaciones más naturales y en tiempo real”, permitiendo a los usuarios interrumpir de manera fluida. También detecta y responde a las emociones de los usuarios e incluso puede tomar pausas para respirar y imitar la risa humana durante las conversaciones. Si aún no tienes acceso, no te preocupes: pronto estará disponible para más usuarios.
Recientemente, OpenAI introdujo oficialmente su esperada función de Voz Avanzada a un grupo limitado de suscriptores de ChatGPT Plus, brindando la oportunidad de exploración. Aunque no se ha precisado el tamaño de este lanzamiento inicial, la compañía se ha comprometido a ampliar el acceso en las próximas semanas, con la expectativa de disponibilidad total para todos los suscriptores Plus este otoño. Si bien muchos usuarios están ansiosos por probarlo, es probable que tengas acceso antes de invierno, a menos que haya retrasos adicionales. Sabrás que tienes acceso cuando recibas una invitación por correo electrónico o una notificación en la aplicación de ChatGPT.
Para utilizar el Modo de Voz Avanzado, los usuarios deben tener una suscripción Plus y un dispositivo Android con la versión de la aplicación 1.2024.206 o posterior, o un iPhone que ejecute iOS 16.4 o superior junto con la misma versión de la aplicación. Es importante destacar que contar con el dispositivo adecuado no garantiza la participación en la fase de lanzamiento alfa. OpenAI no ha revelado los criterios de selección para este modo, pero los usuarios seleccionados recibirán tanto una notificación por correo electrónico como una sugerencia en la aplicación móvil de ChatGPT.
Durante la fase alfa, OpenAI recopilará audio de las conversaciones en el Modo de Voz Avanzado para mejorar sus modelos, siempre que los usuarios no hayan optado por no compartir datos. Para desactivar esta opción, accede a la pestaña de Controles de Datos en la configuración de tu aplicación y desmarca "Mejorar la voz para todos".
OpenAI ha declarado que tanto las entradas como las salidas del Modo de Voz Avanzado tienen límites de uso diario, aunque no se han especificado las duraciones, y esos límites pueden cambiar con el tiempo. Sin embargo, usuarios como Himels Tech han demostrado conversaciones que duran casi 10 minutos. La IA notificará a los usuarios cuando les falten tres minutos, finalizando la charla y volviendo a la interfaz de voz estándar.
En esencia, el Modo de Voz Avanzado proporciona un nuevo método para interactuar con el modelo de lenguaje grande GPT-4, permitiendo a los usuarios utilizarlo para diversas tareas. En resumen, todo lo que se pueda lograr con ChatGPT basado en texto es posible con el Modo de Voz Avanzado, mejorado por sus características vocales divertidas. Los primeros adoptantes están explorando sus capacidades, desde beatboxing hasta narración de cuentos y conteo rápido.
Sin embargo, existen medidas de seguridad y limitaciones en el Modo de Voz Avanzado. Los usuarios no pueden crear memorias, utilizar instrucciones personalizadas ni acceder a GPTs en este modo. Si bien puede recordar detalles de conversaciones anteriores en el Modo de Voz Avanzado, no puede hacer referencia a charlas anteriores realizadas mediante mensajes de texto o la interfaz de voz estándar.
Además, el Modo de Voz Avanzado no podrá realizar cantos, independientemente de las solicitudes. Según OpenAI, “para respetar los derechos de los creadores, hemos implementado varias medidas, incluidos nuevos filtros, para evitar que el Modo de Voz Avanzado produzca contenido musical, como cantar.”