Se espera que la emocionante función avanzada de voz de ChatGPT se lance "la próxima semana".

OpenAI anunció recientemente en X (anteriormente Twitter) que su esperada función de Voz Avanzada para ChatGPT comenzará a desplegarse "la próxima semana", inicialmente para un grupo selecto de suscriptores de ChatGPT Plus. Esta prueba alfa tiene como objetivo recopilar comentarios de los usuarios antes de expandir la función en base a sus aportes.

La Voz Avanzada transforma la interacción del usuario al permitir conversaciones naturales sin depender de indicaciones textuales, similar a hablar con otra persona. Presentada por primera vez en mayo durante el lanzamiento de GPT-4o en el evento Spring Update de la compañía, esta función se distingue de los asistentes digitales típicos como Siri y Google Assistant. A diferencia de estos sistemas, que a menudo ofrecen respuestas preestablecidas, la Voz Avanzada de ChatGPT proporciona respuestas casi instantáneas y similares a las humanas en varios idiomas. El modelo GPT-4o cuenta con un tiempo promedio de respuesta de audio de solo 320 milisegundos, comparable a la velocidad de conversación humana. En el video de demostración, los espectadores pueden ver cómo el modelo interactúa con múltiples usuarios, improvise en inglés y portugués, y muestra emociones humanas, como la risa.

Los detalles sobre cómo se seleccionarán a los participantes para la prueba alfa aún no están claros, aunque deberán ser suscriptores de ChatGPT Plus a $20/mes. Inicialmente programado para junio, el lanzamiento alfa se retrasó para mejorar las capacidades de moderación de contenido del sistema y reforzar su infraestructura tecnológica para manejar la demanda esperada de usuarios. Como se anunció en junio, se espera que el despliegue completo de la Voz Avanzada no ocurra hasta al menos este otoño, y el cronograma dependerá de que la función cumpla con altos estándares de seguridad y confiabilidad.

La integración de capacidades de conversación natural en ChatGPT representa un avance significativo. Este progreso reduce la necesidad de una ventana de contexto, disminuyendo los requisitos de hardware y ampliando las aplicaciones potenciales de la IA, especialmente para usuarios con dificultades de movilidad o destreza. Además, al simplificar las interacciones, esta función allana el camino para una mayor aceptación de la tecnología de IA entre usuarios que pueden estar familiarizados con comandos de voz como "hey Siri", pero que encuentran dificultoso el diseño de mensajes.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles