¡Hoy es el Gran Día!
El cofundador y CEO de OpenAI, Sam Altman, anunció recientemente importantes actualizaciones sobre el famoso ChatGPT y su modelo de lenguaje subyacente, GPT-4.
Cuándo y Dónde
El evento de la Actualización de Primavera comenzará el lunes 13 de mayo de 2024, a las 10 AM PT / 1 PM ET, y se transmitirá en vivo por y su canal de YouTube. Más de 5,000 espectadores ya esperan este evento. Ten en cuenta que la transmisión de YouTube comenzará a las 9 AM PT / 12 PM ET.
Qué Esperar de la Actualización de Primavera de OpenAI
Aunque ha habido especulaciones—como un posible motor de búsqueda para rivalizar con Google—Altman aclaró en X (anteriormente Twitter) que no se anunciará GPT-5 ni un motor de búsqueda. En cambio, insinuó emocionantes nuevos desarrollos: "¡Hemos estado trabajando arduamente en algunas novedades que creemos que a la gente les encantarán! Me parece mágico." El presidente de OpenAI, Greg Brockman, respaldó este sentimiento, prometiendo una “demostración en vivo de algunos trabajos nuevos.”
Especulaciones sobre Nuevas Funciones
Recientes actividades de empleados de OpenAI en X sugieren la introducción de un asistente de audio/voz conversacional, similar al personaje Samantha de la película de ciencia ficción Her (2016). Altman “Le dio me gusta” a una publicación de Spencer Schiff, quien indicó que estaba volviendo a ver Her en preparación para el evento.
Varios investigadores de OpenAI han expresado su entusiasmo por sus próximas presentaciones, sugiriendo que se podría develar algo extraordinario. Entre los entusiastas se encuentran Aidan Clark, Mo Bavarian y Steven Heidel.
Altman también interactuó con el público en Reddit, discutiendo la “Especificación del Modelo” de OpenAI, que describe comportamientos deseables para sus productos de inteligencia artificial. Un usuario preguntó sobre la posibilidad de acceso gratuito a ChatGPT-4 y DALL-E, a lo que Altman insinuó que podría haber una oportunidad.
Sumando a la especulación, el usuario @ananayarora notó servidores webRTC en el código fuente de OpenAI, lo que sugiere posibles capacidades telefónicas dentro de ChatGPT. Además, el usuario de X @testingcatalog reportó actualizaciones recientes en la aplicación de ChatGPT para iOS, indicando mejoras en la interfaz conversacional.
Funciones de Voz Existentes
Desde diciembre de 2023, el ChatGPT de OpenAI cuenta con una interfaz de voz en iOS y Android, permitiendo interacciones por voz con los usuarios. La función “Leer en voz alta”, introducida en marzo de 2024, permite a ChatGPT leer respuestas en voz alta utilizando voces generadas por IA.
OpenAI presentó una tecnología de clonación de voz que puede replicar la voz de un hablante con solo una grabación de 15 segundos. Sin embargo, esta tecnología aún no se ha lanzado públicamente, lo que refleja el compromiso de OpenAI con un uso responsable.
Se espera que un nuevo asistente conversacional de audio mejore estas funciones, permitiendo un diálogo más natural y fluido.
Desarrollos Futuros
Además, el usuario @alwaysaq00 descubrió una referencia a un nuevo modelo, denominado GPT-4 Omni (o GPT-4o), lo que ha despertado curiosidad sobre sus implicaciones.
Lo que OpenAI revele hoy promete generar entusiasmo y debate dentro de las comunidades de IA y tecnología. ¿Cumplirá con las altas expectativas, incluso sin GPT-5?