OpenAI Presenta el Modelo de Inferencia o1: Superando GPT-4 con Capacidades de Nivel Doctorado en Física y Biología

Recientemente, OpenAI presentó su último modelo "Strawberry", conocido como "o1". Esta nueva serie de modelos de inteligencia artificial está diseñada para involucrarse en un pensamiento más profundo antes de responder preguntas.

En comparación con los modelos anteriores, que se centraban en la ciencia, la codificación y las matemáticas, el modelo o1 sobresale en tareas de razonamiento complejo y en la resolución de problemas desafiantes. A través de un entrenamiento mejorado, la serie o1 no solo refina sus procesos de pensamiento, sino que también explora diversas estrategias y cuenta con capacidades de autocorrección.

Las evaluaciones de OpenAI indican que el modelo o1 rinde a nivel de doctorado en pruebas de referencia en física, química y biología. En matemáticas y codificación, o1 también se destaca: durante el examen de clasificación de la Olimpiada Internacional de Matemáticas (IMO), el modelo anterior GPT-4o respondió correctamente solo el 13% de las preguntas, mientras que el modelo o1 alcanzó una impresionante tasa de precisión del 83%. Además, o1 se ubicó en el percentil 89 en competiciones de Codeforces, lo que demuestra su excepcional talento en codificación.

Aunque o1 aún no cuenta con algunas funciones prácticas de ChatGPT, como navegación web y carga de archivos, OpenAI destaca que o1 es especialmente competente para resolver problemas científicos y matemáticos complejos. Investigadores médicos pueden utilizar o1 para analizar datos de secuenciación celular, físicos pueden generar ecuaciones matemáticas complejas para la óptica cuántica, y desarrolladores pueden emplear o1 para crear flujos de trabajo multinivel.

OpenAI también lanzó o1-mini, un modelo de razonamiento más rápido y económico, ideal para aplicaciones de codificación. o1-mini tiene un precio un 80% más bajo que o1, lo que lo convierte en una opción asequible para escenarios que requieren razonamiento sin un amplio conocimiento general.

En términos de seguridad, OpenAI ha introducido un nuevo enfoque de entrenamiento que aprovecha las capacidades de razonamiento del modelo o1 para mejorar el cumplimiento de normas de seguridad y alineación. En pruebas de jailbreak, o1-preliminar obtuvo 84 puntos, en comparación con los 22 de GPT-4o, lo que demuestra mejoras significativas en la mantención de la seguridad.

Actualmente, las versiones preliminares de o1 y o1-mini están disponibles en ChatGPT (Plus y Team) y a través de la API, con planes de hacer que o1-mini esté accesible para todos los usuarios gratuitos de ChatGPT en el futuro.

Most people like

Find AI tools in YBX