El modelo de inteligencia artificial Llama de código abierto de Groq supera a GPT-4o y Claude en la ejecución de funciones, ocupando el primer lugar en la tabla de clasificación.

Home Noticias de IA El modelo de inteligencia artificial Llama de código abierto de Groq supera a GPT-4o y Claude en la ejecución de funciones, ocupando el primer lugar en la tabla de clasificación.

Groq, una innovadora startup de hardware de IA, ha lanzado dos modelos de lenguaje de código abierto que superan a los de grandes empresas tecnológicas en sus capacidades especializadas de uso de herramientas. El modelo Llama-3-Groq-70B-Tool-Use se ha posicionado en la cima del Berkeley Function Calling Leaderboard (BFCL), superando los modelos propios de OpenAI, Google y Anthropic.

Rick Lamers, líder del proyecto en Groq, compartió este logro en una publicación en X.com: “Me enorgullece anunciar los modelos Llama 3 Groq Tool Use 8B y 70B. Este ajuste completo de Llama 3 de código abierto alcanza la posición #1 en el BFCL, superando todos los demás modelos, incluidos los propietarios como Claude Sonnet 3.5, GPT-4 Turbo, GPT-4o y Gemini 1.5 Pro.”

El modelo más grande de 70B parámetros alcanzó una impresionante precisión del 90.76% en el BFCL, mientras que el modelo más pequeño de 8B obtuvo un 89.06%, ocupando el tercer lugar. Estos resultados demuestran que los modelos de código abierto pueden no solo competir, sino también superar el rendimiento de las alternativas de código cerrado en tareas específicas.

Desarrollados en colaboración con la firma de investigación en IA Glaive, los modelos de Groq emplearon un ajuste completo y Optimización Directa de Preferencias (DPO) sobre el modelo base Llama-3 de Meta. El equipo se aseguró de utilizar únicamente datos sintéticos generados éticamente para el entrenamiento, abordando preocupaciones sobre la privacidad de los datos y el sobreajuste.

Este avance significa un cambio crucial en el panorama de la IA. Al lograr un rendimiento superior utilizando exclusivamente datos sintéticos, Groq desafía la creencia de que se necesitan vastas cantidades de datos del mundo real para desarrollar modelos avanzados de IA. Este enfoque innovador podría aliviar preocupaciones sobre la privacidad y reducir el impacto ambiental asociado con el entrenamiento masivo de datos. Además, abre caminos para crear modelos de IA especializados en campos donde los datos del mundo real son limitados o sensibles.

Groq ha hecho estos modelos accesibles a través de la API de Groq y Hugging Face, una plataforma líder para modelos de aprendizaje automático. Esta accesibilidad promete impulsar la innovación en áreas que requieren un uso complejo de herramientas y llamadas a funciones, como la codificación automatizada y el análisis de datos.

Para involucrar más a la comunidad, Groq ha lanzado una demostración pública en Hugging Face Spaces, permitiendo a los usuarios interactuar con el modelo y evaluar sus capacidades de uso de herramientas. Desarrollada en colaboración con Gradio, adquirido por Hugging Face en diciembre de 2021, la demostración ha recibido atención positiva de investigadores y desarrolladores ansiosos por explorar el potencial de los modelos.

La estrategia de código abierto de Groq contrasta notablemente con los sistemas cerrados utilizados por las grandes empresas tecnológicas, lo que podría alentar a los líderes de la industria a adoptar una mayor transparencia y acelerar el desarrollo de la IA. El lanzamiento de estos modelos de alto rendimiento de código abierto consolida la posición de Groq como un actor significativo en la IA. A medida que investigadores, empresas y responsables de políticas examinan las implicaciones de esta tecnología, el potencial para una mayor accesibilidad e innovación en la IA es claro. El éxito de Groq podría marcar el inicio de una nueva era en el desarrollo y despliegue de la IA, democratizando capacidades avanzadas y fomentando un ecosistema más diverso e innovador.

Apple Muestra Sus Capacidades de IA: Nuevos Modelos Superan el Rendimiento de Mistral y Hugging Face

Cómo la IA está Cerrando las Brechas de Identidad y de Puntos Finales para Combatir la Explotación por Parte de los Atacantes

Most people like

AISEO - Your AI writer for SEO

451K

AISEO es un potente asistente de escritura diseñado para crear contenido optimizado rápidamente, y cuenta con una avanzada herramienta de parafraseo. Ya sea que estés redactando entradas de blog o mejorando tu contenido web, AISEO simplifica el proceso de escritura, garantizando resultados de alta calidad en tiempo récord.

Asistente de escritura AI AI Content Generator

MultiChat AI

49.3K

Participa en conversaciones dinámicas con diversos modelos de lenguaje de código abierto (LLMs) para una experiencia enriquecedora. Descubre el poder de estas herramientas avanzadas mientras exploras sus capacidades y aplicaciones únicas. Ya sea que busques mejorar tus proyectos o simplemente sientas curiosidad por la IA, conectar con múltiples LLMs abre un mundo de posibilidades.

chatbot AI Chatbot

Nexlev

124.2K

Descubre oportunidades ocultas en YouTube con las ideas impulsadas por IA de NexLev.io.

YouTube AI Course

ReadPartner

7.2K

Descubre el poder de nuestra herramienta de Resumen y Digestión de Noticias con IA, diseñada para mantenerte actualizado con las últimas noticias sin esfuerzo. Esta herramienta de vanguardia aprovecha las capacidades de la inteligencia artificial para seleccionar y resumir artículos de noticias, brindándote información concisa y relevante adaptada a tus intereses. Mantente informado sin agobios y mejora tu experiencia de lectura con perspectivas seleccionadas del mundo de las noticias.

Herramienta de resumen de IA Summarizer

Find AI tools in YBX