Groq, una innovadora startup de hardware de IA, ha lanzado dos modelos de lenguaje de código abierto que superan a los de grandes empresas tecnológicas en sus capacidades especializadas de uso de herramientas. El modelo Llama-3-Groq-70B-Tool-Use se ha posicionado en la cima del Berkeley Function Calling Leaderboard (BFCL), superando los modelos propios de OpenAI, Google y Anthropic.
Rick Lamers, líder del proyecto en Groq, compartió este logro en una publicación en X.com: “Me enorgullece anunciar los modelos Llama 3 Groq Tool Use 8B y 70B. Este ajuste completo de Llama 3 de código abierto alcanza la posición #1 en el BFCL, superando todos los demás modelos, incluidos los propietarios como Claude Sonnet 3.5, GPT-4 Turbo, GPT-4o y Gemini 1.5 Pro.”
El modelo más grande de 70B parámetros alcanzó una impresionante precisión del 90.76% en el BFCL, mientras que el modelo más pequeño de 8B obtuvo un 89.06%, ocupando el tercer lugar. Estos resultados demuestran que los modelos de código abierto pueden no solo competir, sino también superar el rendimiento de las alternativas de código cerrado en tareas específicas.
Desarrollados en colaboración con la firma de investigación en IA Glaive, los modelos de Groq emplearon un ajuste completo y Optimización Directa de Preferencias (DPO) sobre el modelo base Llama-3 de Meta. El equipo se aseguró de utilizar únicamente datos sintéticos generados éticamente para el entrenamiento, abordando preocupaciones sobre la privacidad de los datos y el sobreajuste.
Este avance significa un cambio crucial en el panorama de la IA. Al lograr un rendimiento superior utilizando exclusivamente datos sintéticos, Groq desafía la creencia de que se necesitan vastas cantidades de datos del mundo real para desarrollar modelos avanzados de IA. Este enfoque innovador podría aliviar preocupaciones sobre la privacidad y reducir el impacto ambiental asociado con el entrenamiento masivo de datos. Además, abre caminos para crear modelos de IA especializados en campos donde los datos del mundo real son limitados o sensibles.
Groq ha hecho estos modelos accesibles a través de la API de Groq y Hugging Face, una plataforma líder para modelos de aprendizaje automático. Esta accesibilidad promete impulsar la innovación en áreas que requieren un uso complejo de herramientas y llamadas a funciones, como la codificación automatizada y el análisis de datos.
Para involucrar más a la comunidad, Groq ha lanzado una demostración pública en Hugging Face Spaces, permitiendo a los usuarios interactuar con el modelo y evaluar sus capacidades de uso de herramientas. Desarrollada en colaboración con Gradio, adquirido por Hugging Face en diciembre de 2021, la demostración ha recibido atención positiva de investigadores y desarrolladores ansiosos por explorar el potencial de los modelos.
La estrategia de código abierto de Groq contrasta notablemente con los sistemas cerrados utilizados por las grandes empresas tecnológicas, lo que podría alentar a los líderes de la industria a adoptar una mayor transparencia y acelerar el desarrollo de la IA. El lanzamiento de estos modelos de alto rendimiento de código abierto consolida la posición de Groq como un actor significativo en la IA. A medida que investigadores, empresas y responsables de políticas examinan las implicaciones de esta tecnología, el potencial para una mayor accesibilidad e innovación en la IA es claro. El éxito de Groq podría marcar el inicio de una nueva era en el desarrollo y despliegue de la IA, democratizando capacidades avanzadas y fomentando un ecosistema más diverso e innovador.