Un innovador modelo de lenguaje de código abierto ha reclamado el título de mejor del mundo, según las últimas clasificaciones de Hugging Face, una plataforma líder en investigación y aplicaciones de procesamiento del lenguaje natural (NLP). El modelo, llamado “Smaug-72B,” fue lanzado hoy por Abacus AI, una startup enfocada en resolver desafíos complejos en inteligencia artificial y aprendizaje automático. Smaug-72B es una versión optimizada de “Qwen-72B,” otro destacado modelo de lenguaje presentado hace solo unos meses por un equipo de investigación de Alibaba Group.
Significativamente, Smaug-72B supera a GPT-3.5 de OpenAI y Mistral Medium—dos de los modelos de lenguaje propietarios más avanzados—en varias métricas clave. Notablemente, también supera a Qwen-72B por un margen considerable en muchas evaluaciones. Según el ranking de Hugging Face Open LLM, que evalúa el rendimiento de modelos de lenguaje de código abierto en diversas tareas de procesamiento del lenguaje natural, Smaug-72B es ahora el primer y único modelo de código abierto con una puntuación promedio superior a 80 en todas las evaluaciones principales. Aunque aún no ha alcanzado el promedio de 90-100 puntos que indica un rendimiento a nivel humano, su lanzamiento señala un posible cambio en el panorama de la IA de código abierto, sugiriendo que pronto podría rivalizar con las capacidades de las grandes empresas tecnológicas, tradicionalmente consideradas inalcanzables.
La Ventaja del Código Abierto
“Smaug-72B de Abacus AI lidera la tabla de LLM como el primer modelo en lograr una puntuación promedio de 80,” comentó Bindu Reddy, CEO de Abacus AI, en una publicación en X.com. “Nuestro próximo objetivo es publicar estas técnicas como un artículo de investigación y aplicarlas a los principales modelos de Mistral, incluyendo Miqu, una versión de 70B afinada de LLama-2. Las técnicas que empleamos se enfocan específicamente en habilidades de razonamiento y matemáticas, lo que explica los impresionantes puntajes de GSM8K. Proporcionaremos más información en nuestro próximo artículo.”
Desde su lanzamiento, Smaug-72B se distingue no solo por su rendimiento general, sino también por sus excepcionales capacidades en razonamiento y tareas matemáticas—mejoradas por técnicas de ajuste específicas aplicadas por Abacus AI. Estas técnicas abordan debilidades comunes en modelos de lenguaje grandes, conduciendo a un mejor desempeño.
Otros desarrollos notables de código abierto incluyen Qwen 1.5, una suite de modelos de lenguaje pequeños pero poderosos que van desde 0.5B hasta 72B parámetros, lanzada por Qwen. Qwen 1.5 supera modelos propietarios populares como Mistral Medium y GPT-3.5, con una longitud de contexto de 32k y compatibilidad con diversas herramientas para inferencia local rápida. Además, Qwen presentó Qwen-VL-Max, un nuevo modelo de lenguaje de visión que compite con Gemini Ultra de Google y GPT-4V de OpenAI.
Implicaciones para el Futuro de la IA
El ascenso de Smaug-72B y Qwen 1.5 ha generado entusiasmo y debates tanto en la comunidad de IA como en los círculos tecnológicos más amplios. Muchos expertos han elogiado las contribuciones de Abacus AI y Qwen a la IA de código abierto, destacando los rápidos avances logrados en el último año. “Es increíble pensar que hace menos de un año estábamos emocionados con modelos como Dolly,” reflexionó Sahar Mor, un influyente analista de IA, en LinkedIn, a propósito del progresivo avance en modelos de código abierto.
Tanto Smaug-72B como Qwen 1.5 están disponibles para acceso público en Hugging Face, permitiendo a los usuarios descargarlos, utilizarlos y modificarlos a su antojo. Abacus AI y Qwen también tienen la intención de presentar sus modelos en la tabla de evaluación humana llmsys—una nueva métrica diseñada para medir el rendimiento de los modelos de lenguaje en tareas similares a las humanas. Insinuaron proyectos futuros enfocados en producir más modelos de código abierto y explorar diversas aplicaciones.
Smaug-72B y Qwen 1.5 ejemplifican la rápida evolución de la IA de código abierto en los últimos meses. Significan una ola transformadora de innovación y democratización, desafiando el dominio de las grandes empresas tecnológicas y ampliando las oportunidades para desarrolladores e investigadores. Aunque el futuro del liderazgo de Smaug-72B en la tabla de Hugging Face aún está por verse, está claro que la IA de código abierto está ganando un impulso sustancial.