Desde el lanzamiento del potente modelo de lenguaje GPT-4 de OpenAI en marzo de 2023, los usuarios y desarrolladores han esperado con entusiasmo la llegada de su sucesor, GPT-5. Sin embargo, OpenAI ha optado por un enfoque diferente al introducir una nueva familia de modelos: la serie o1.
Introducción de la Familia de Modelos o1
OpenAI ha presentado sus últimos modelos de IA, o1-preview y o1-mini, diseñados específicamente para abordar tareas complejas y resolver problemas desafiantes de manera más efectiva que la serie GPT.
Disponibles hoy para usuarios de ChatGPT Plus, el o1-preview está limitado a 30 mensajes por semana, mientras que el o1-mini permite enviar 50 mensajes. Es importante señalar que, al ser modelos iniciales, sus funcionalidades están en desarrollo; actualmente carecen de características como navegación web y carga de archivos, que están disponibles en GPT-4.
Capacidades Superiores de los Modelos o1
OpenAI afirma que la serie o1 se destaca en el manejo de problemas complejos en diversos campos, incluyendo la ciencia, la salud y la tecnología. Estos modelos están diseñados para ayudar a los físicos a formular ecuaciones complejas y a investigadores en salud a anotar datos de secuenciación celular de manera efectiva.
El modelo o1-mini ofrece características robustas para desarrolladores, siendo adecuado para ejecutar flujos de trabajo de múltiples pasos, depurar código y enfrentar desafíos de programación.
o1-preview: Rendimiento a Nivel de Doctorado
El modelo o1-preview asigna más tiempo para respuestas reflexivas, imitando el enfoque de resolución de problemas de los humanos. Las pruebas han demostrado que su rendimiento es comparable al de estudiantes de doctorado en física, química y biología. En programación, se sitúa en el percentil 89 en competiciones de Codeforces, demostrando alta competencia en depuración y generación de soluciones. En el examen de calificación de la Olimpiada Internacional de Matemáticas, resolvió el 83% de los problemas, superando significativamente la tasa de éxito del 13% de GPT-4.
Este modelo está actualmente accesible para usuarios de ChatGPT Plus y Team, y los usuarios de Enterprise y Edu tendrán acceso la próxima semana. Además, los desarrolladores elegibles para el nivel 5 de API pueden aprovechar los modelos o1, aunque se aplicarán límites iniciales de tasa.
o1-mini: Asequible y Eficiente
Junto al o1-preview, OpenAI presentó el modelo o1-mini, una versión optimizada que ofrece capacidades de razonamiento más rápidas y económicas. Aunque se especializa en codificación y áreas STEM, el o1-mini también logró resultados impresionantes, alcanzando un 70% en el benchmark matemático de la IMO, cerca del 74% del o1-preview, pero a un costo significativamente menor. En evaluaciones de codificación, obtuvo un puntaje Elo de 1650 en Codeforces, colocándose entre el 86% superior de programadores.
Con un precio reducido en un 80% en comparación con el o1-preview, el o1-mini está dirigido a desarrolladores e investigadores que buscan capacidades de razonamiento sin el extenso conocimiento del modelo más avanzado. Estará disponible para usuarios de ChatGPT Plus, Team, Enterprise y Edu, con planes de incluir a usuarios de ChatGPT Free en el futuro.
Mejoras en Seguridad
El compromiso de OpenAI con la seguridad es evidente en ambos modelos, que cuentan con mecanismos de entrenamiento mejorados. El modelo o1-preview obtuvo un impresionante 84 en una de las evaluaciones más desafiantes de desbloqueo, una mejora significativa respecto al puntaje de 22 de GPT-4. La capacidad de estos modelos para razonar sobre protocolos de seguridad en contexto les permite manejar solicitudes inseguras y mitigar el riesgo de generación de contenido inapropiado.
OpenAI también ha establecido asociaciones con los Institutos de Seguridad de IA de EE.UU. y Reino Unido, facilitando la evaluación y prueba de futuros sistemas de IA.
Desarrollos Futuros para la Serie o1
Si bien el o1-preview y el o1-mini son herramientas poderosas para la resolución de problemas, OpenAI reconoce que esto es solo el comienzo. La empresa planea mejorar estos modelos de manera regular, añadiendo características como navegación, carga de archivos y llamadas de función en futuras actualizaciones.
A medida que OpenAI sigue desarrollando las series GPT y o1, se pueden esperar avances continuos que mejoren las capacidades y la accesibilidad de la IA en diversas aplicaciones.