O Modelo de IA Llama de Código Aberto da Groq Supera o GPT-4o e o Claude em Chamadas de Função, Assumindo a Primeira Posição no Ranking.

A Groq, uma startup inovadora de hardware em IA, lançou dois modelos de linguagem de código aberto que superam os oferecidos por grandes players de tecnologia em suas capacidades de uso de ferramentas. O modelo Llama-3-Groq-70B-Tool-Use lidera o Berkeley Function Calling Leaderboard (BFCL), ultrapassando modelos proprietários da OpenAI, Google e Anthropic.

Rick Lamers, líder do projeto da Groq, compartilhou essa conquista em uma postagem no X.com: “Estou orgulhoso de anunciar os modelos Llama 3 Groq Tool Use 8B e 70B. Este ajuste completo de uso de ferramentas do Llama 3 alcançou a posição #1 no BFCL, superando todos os outros modelos, incluindo os proprietários como Claude Sonnet 3.5, GPT-4 Turbo, GPT-4o e Gemini 1.5 Pro.”

O modelo maior, com 70 bilhões de parâmetros, obteve uma impressionante precisão geral de 90,76% no BFCL, enquanto o modelo menor, de 8 bilhões, alcançou 89,06%, classificando-se em terceiro. Esses resultados mostram que os modelos de código aberto podem não apenas competir, mas também superar o desempenho de alternativas de código fechado em tarefas específicas.

Desenvolvidos em colaboração com a empresa de pesquisa em IA Glaive, os modelos da Groq usaram ajuste fino completo e Otimização de Preferência Direta (DPO) no modelo base Llama-3 da Meta. A equipe garantiu que apenas dados sintéticos gerados eticamente fossem utilizados para o treinamento, abordando preocupações sobre privacidade de dados e overfitting.

Esse desenvolvimento representa uma mudança crucial no cenário da IA. Ao alcançar um desempenho excepcional usando exclusivamente dados sintéticos, a Groq desafia a ideia de que grandes volumes de dados do mundo real são essenciais para desenvolver modelos avançados de IA. Essa abordagem inovadora pode mitigar preocupações com a privacidade e reduzir o impacto ambiental frequentemente associado ao treinamento com dados em massa. Além disso, abre caminhos para a criação de modelos de IA especializados em áreas onde os dados do mundo real são limitados ou sensíveis.

A Groq disponibilizou esses modelos por meio da Groq API e Hugging Face, uma plataforma líder em modelos de aprendizado de máquina. Essa acessibilidade promete impulsionar a inovação em áreas que exigem uso complexo de ferramentas e chamadas de função, como codificação automatizada e análise de dados.

Para engajar ainda mais a comunidade, a Groq lançou uma demonstração pública no Hugging Face Spaces, permitindo que os usuários interajam com o modelo e avaliem suas capacidades de uso de ferramentas. Desenvolvida em colaboração com a Gradio, adquirida pelo Hugging Face em dezembro de 2021, a demonstração atraiu atenção positiva de pesquisadores e desenvolvedores ansiosos para explorar o potencial dos modelos.

A estratégia de código aberto da Groq contrasta fortemente com os sistemas fechados usados por grandes empresas de tecnologia, potencialmente incentivando os líderes do setor a adotarem maior transparência e acelerarem o desenvolvimento de IA. O lançamento desses modelos de alto desempenho consolida a posição da Groq como um player significativo em IA. À medida que pesquisadores, empresas e formuladores de políticas analisam as implicações dessa tecnologia, o potencial para aumentar a acessibilidade e a inovação em IA permanece claro. O sucesso da Groq pode sinalizar uma nova era no desenvolvimento e na implementação de IA, democratizando capacidades avançadas e promovendo um ecossistema mais diverso e inovador.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles