OpenAI ha anunciado una nueva función que permite a desarrolladores de terceros personalizar su modelo multimodal grande (LMM), GPT-4o. Esta personalización permite a los desarrolladores modificar el comportamiento del modelo para adaptarlo mejor a las necesidades específicas de sus aplicaciones u organizaciones.
La personalización permite ajustar el tono, seguir directrices específicas y mejorar la precisión de tareas técnicas, demostrando ser efectiva incluso con datos limitados. Los desarrolladores interesados pueden acceder al panel de personalización de OpenAI, seleccionar "crear" y elegir gpt-4o-2024-08-06 en el menú desplegable de modelos base. Este anuncio sigue a la introducción de la variante más pequeña y rápida, GPT-4o mini, que, aunque menos potente, también se puede personalizar.
"El ajuste fino puede mejorar significativamente el rendimiento del modelo en diversos campos, desde la programación hasta la escritura creativa", afirman los técnicos de OpenAI, John Allard y Steven Heidel, en una publicación del blog de la empresa. "Esto es solo el comienzo; continuaremos ampliando las opciones de personalización para los desarrolladores."
Tokens Gratuitos Disponibles Hasta el 23 de Septiembre
OpenAI destaca que los desarrolladores pueden lograr resultados impresionantes con solo unas pocas docenas de ejemplos de entrenamiento. Para celebrar esta nueva función, OpenAI ofrece hasta 1 millón de tokens gratuitos por día para personalizar GPT-4o hasta el 23 de septiembre de 2024.
Los tokens son representaciones numéricas de conceptos y son esenciales para los procesos de entrada y salida del modelo. Los desarrolladores deben convertir sus datos en tokens (tokenización) para ajustar eficazmente GPT-4o, utilizando las herramientas de OpenAI para este proceso.
Normalmente, el ajuste fino de GPT-4o cuesta $25 por millón de tokens, mientras que operar el modelo ajustado incurre en gastos de $3.75 por millón de tokens de entrada y $15 por millón de tokens de salida. Para quienes utilizan el GPT-4o mini, hay disponibles hasta 2 millones de tokens de entrenamiento gratuitos al día hasta la fecha límite de septiembre, asegurando un acceso amplio a las funciones de personalización.
La iniciativa de OpenAI para ofrecer tokens gratuitos responde a la feroz competencia de proveedores como Google y Anthropic, así como de modelos de código abierto como Hermes 3 de Nous Research, basado en Llama 3.1 de Meta. Sin embargo, los desarrolladores que usan modelos de OpenAI se benefician de la conveniencia de no tener que alojar la inferencia o el entrenamiento en sus propios servidores; pueden utilizar la infraestructura de OpenAI o conectar sus servidores a través de la API de OpenAI.
Historias de Éxito que Demuestran el Potencial del Ajuste Fino
El lanzamiento de la personalización de GPT-4o sigue a extensas pruebas con socios selectos, mostrando el potencial de modelos personalizados en diversos sectores. Por ejemplo, la firma de IA Cosine logró un resultado de vanguardia del 43.8% en el benchmark SWE-bench con su agente de IA ingeniera autónoma personalizado, Genie, el más alto entre los modelos de IA declarados públicamente hasta la fecha.
De manera similar, Distyl, un proveedor de soluciones de IA para empresas Fortune 500, alcanzó la mejor clasificación en el benchmark BIRD-SQL con GPT-4o ajustado, logrando una precisión de ejecución del 71.83%. El modelo destacó en tareas SQL, incluyendo reformulación de consultas y auto-corrección.
Priorizando la Seguridad y la Privacidad de los Datos en el Ajuste Fino
OpenAI sostiene que la seguridad y la privacidad de los datos son primordiales mientras amplía las opciones de personalización para los desarrolladores. Los modelos ajustados otorgan a las organizaciones control total sobre sus datos, asegurando que las entradas y salidas no se utilicen para entrenar otros modelos.
OpenAI también ha implementado múltiples medidas de seguridad, incluyendo evaluaciones automatizadas y monitoreo del uso, para asegurar el cumplimiento de sus políticas. Sin embargo, investigaciones indican que el ajuste fino puede a veces llevar a desviaciones de los protocolos de seguridad y afectar el rendimiento general del modelo. En última instancia, las organizaciones deben sopesar los riesgos potenciales frente a los beneficios del ajuste fino.
Con la reciente introducción de capacidades de ajuste fino, OpenAI refuerza su visión de que en el futuro, la mayoría de las organizaciones desarrollarán modelos adaptados a su industria o necesidades comerciales específicas. Esta nueva oferta marca un paso significativo hacia esa meta, subrayando el compromiso de OpenAI de permitir a cada organización tener su propio modelo de IA personalizado.