OpenAI ha lanzado nuevas funciones de voz para ChatGPT, permitiendo a todos los usuarios, incluidos aquellos con cuentas gratuitas, interactuar con la IA mediante comandos de voz. Esta actualización innovadora permite a los usuarios simplemente hablar con la aplicación, que procesa la entrada de audio y genera una respuesta hablada, creando una experiencia más interactiva.
En una reciente demostración en X, los desarrolladores presentaron un escenario real para mostrar las capacidades de la función de voz. Solicitaron ayuda a ChatGPT para decidir cuántas pizzas pedir para el equipo después de una larga noche de trabajo. Esto resalta las aplicaciones prácticas de esta herramienta, convirtiéndola en un recurso invaluable para diversas necesidades conversacionales.
La nueva capacidad de voz utiliza Whisper v3, la última versión de la avanzada tecnología de reconocimiento de voz de OpenAI. Presentado en el reciente evento DevDay, Whisper v3 está diseñado para ofrecer una mayor precisión y un uso comercial más amplio, facilitando la comunicación natural con la IA.
Anteriormente, los usuarios solo podían acceder a las funciones de entrada de voz e imagen si estaban suscritos a ChatGPT Plus o Enterprise. Sin embargo, este último lanzamiento representa un paso significativo hacia la disponibilidad de estas herramientas para un público más amplio, destacando el compromiso de OpenAI con la mejora de la experiencia del usuario mediante tecnología avanzada.
Además de las capacidades de voz, ChatGPT ahora también puede interpretar imágenes como indicaciones, introducidas en una actualización anterior. Esta increíble combinación ofrece un modelo de interacción dinámico y completo, que permite a los usuarios acceder a información y soluciones de manera más fluida e intuitiva. El continuo mejoramiento de ChatGPT demuestra la dedicación de OpenAI a ampliar los límites de lo posible en la comunicación impulsada por IA.