OpenAI parece estar abordando activamente las preocupaciones sobre sus modelos de lenguaje GPT tras las críticas que señalaban que GPT-4 se estaba volviendo “perezoso”, “tonto” y experimentando errores atípicos, especialmente notados en redes sociales a finales de noviembre.
Ha surgido la especulación de que GPT-4.5 podría haberse introducido de manera encubierta a ciertos usuarios, insinuado por algunas respuestas de ChatGPT. Independientemente de la validez de esta teoría, hay indicios de mejoras internas significativas en GPT-4 en las últimas semanas.
Desde el jueves pasado, los usuarios comenzaron a reportar mejoras en el rendimiento de GPT-4. El profesor de Wharton, Ethan Mollick, quien había señalado previamente una disminución en las capacidades de GPT-4 en noviembre, comentó sobre una mejora notable en la eficiencia y calidad de las respuestas del modelo, aunque sin evidencia de un cambio a GPT-4.5. Después de utilizar un intérprete de código para hacer correcciones, describió la diferencia como “noche y día”, en contraste con sus experiencias anteriores donde GPT-4 era “poco confiable y algo aburrido durante semanas.”
Durante este tiempo, OpenAI también reabrió las suscripciones de ChatGPT Plus el miércoles pasado, después de haber detenido las inscripciones desde el 14 de noviembre. En una publicación en X, Altman reconoció la paciencia de los usuarios mientras se procuraban GPU adicionales.
Aunque no está claro si existe un vínculo directo entre la reapertura de las inscripciones de ChatGPT Plus y las mejoras en GPT-4, la coincidencia es notable. Las inscripciones habían cesado poco después del primer DevDay de OpenAI, que introdujo varias nuevas funciones para la versión premium del chatbot de IA. La empresa había implementado una lista de espera para las suscripciones de ChatGPT Plus debido a la abrumadora demanda posterior al DevDay.
Las quejas de los usuarios habían resaltado previamente problemas con GPT-4, donde este proporcionaba explicaciones sobre cómo ejecutar comandos en lugar de realizar las tareas. Tras estas quejas, surgieron informes de comportamientos inusuales de GPT-4, desviándose de las peculiaridades típicas de la IA a las que los usuarios estaban acostumbrados. Un problema frecuente involucraba a GPT-4 "desafiar" a los usuarios o necesitar múltiples aclaraciones antes de ejecutar solicitudes. Otra queja común era su tendencia a explicar en lugar de completar comandos.
El declive en el rendimiento de GPT-4 se puede rastrear desde al menos julio, con un estudio que indica una disminución significativa en la precisión entre marzo y junio. Muchos, incluido el vicepresidente de producto de OpenAI, Peter Welinder, sugirieron que las deficiencias percibidas en la calidad de las respuestas podrían surgir de efectos psicológicos mientras el modelo pasaba por actualizaciones. Algunos usuarios han propuesto que modificar sus consultas podría ayudar a obtener mejores resultados.
Aunque OpenAI se ha mantenido relativamente callado sobre sus desarrollos internos, la publicación de Altman con respecto a las GPU probablemente sirve como un indicador importante de los cambios en curso. Informes de abril sugirieron que OpenAI necesitaría más de 30,000 unidades de GPU para mantener su rendimiento comercial durante el resto de 2023, incluso antes del aumento de interés observado en noviembre.
La especulación sobre GPT-4.5 ha aumentado, alimentada por filtraciones que detallan una posible nueva versión. Rowan Cheung, fundador del boletín @therundownai, compartió información sobre precios y capacidades multimodales avanzadas asociadas con este desarrollo en X. Cuando Cheung preguntó sobre la autenticidad de estos detalles, Altman simplemente respondió: “Nah.”
La especulación sobre GPT-4.5 comenzó con una supuesta imagen que mostraba las características y precios del nuevo modelo. Sin embargo, Altman desestimó los rumores como infundados.
No obstante, los usuarios que creen haber encontrado la actualización propuesta afirman que están experimentando GPT-4.5, citando un rendimiento superior. Algunos incluso consultaron al chatbot sobre su modelo, recibiendo respuestas como “GPT-4.5 Turbo.” Esto ha llevado a muchos a teorizar que OpenAI podría estar realizando pruebas beta de GPT-4.5 principalmente a través de sus aplicaciones móviles. Sin embargo, no todos los usuarios pueden replicar estos hallazgos, a menudo se les dice que están usando el GPT-4 estándar. El empleado de OpenAI, Will Depue, se refirió a las variaciones como una “ilusión muy extraña y extrañamente consistente.”
Cheung señaló una publicación de la página oficial de ChatGPT en X que presentaba emojis de un cerebro y nubes, que interpreta como un sutil reconocimiento por parte de OpenAI del fenómeno de la alucinación. Es notable que OpenAI proporcione acceso anticipado a usuarios de pago, incluidos ChatGPT Plus, usuarios de API para desarrolladores y clientes empresariales. Dado que estos usuarios son a menudo los primeros en probar nuevas versiones y funciones de GPT, aquellos que experimentan con el rendimiento del modelo probablemente tienen algún tipo de acceso a la API de desarrollador.
Incluso si OpenAI está probando actualmente GPT-4.5, el cronograma para cualquier actualización oficial sigue siendo incierto, especialmente mientras la empresa se estabiliza tras recientes desafíos organizativos. A medida que el producto continúa evolucionando, es evidente que cualquier “versión” de ChatGPT en uso puede ser menos relevante que las mejoras tangibles que se están realizando.