A Meta lançou recentemente o Llama 3.1, apresentando-o como o "modelo fundamental de código aberto mais poderoso" disponível atualmente. De acordo com um post oficial no blog, este lançamento representa um momento crucial no avanço dos grandes modelos de código aberto, marcando o início de uma nova era em inteligência artificial (IA).
A série Llama sempre esteve na vanguarda dos modelos de grande porte de código aberto, com a Meta ao lado da OpenAI, simbolizando o futuro tanto das tecnologias de código aberto quanto das proprietárias. Durante o lançamento do Llama 3.1, o CEO da Meta, Mark Zuckerberg, destacou a importância do código aberto para a evolução positiva da IA, anunciando planos para estabelecer a IA de código aberto como o padrão da indústria.
O Llama 3.1 está disponível em três tamanhos de parâmetros: 8B, 70B e 405B, atendendo a diversas aplicações, como agentes multilíngues, raciocínio complexo e assistência em programação. O modelo apresenta uma janela de contexto expandida de 128K, um aumento significativo em relação aos 8K anteriores, e suporta múltiplas línguas, incluindo inglês, alemão e francês. Além disso, possui capacidades aprimoradas de ferramentas, permitindo integração com motores de busca e raciocínio matemático por meio do Wolfram Alpha, tudo isso com um modelo de licenciamento mais flexível, que permite aos usuários otimizar outros modelos de linguagem de grande porte (LLMs) utilizando o Llama 3.1.
Avaliações de benchmark indicam que o modelo de 405B de parâmetros do Llama 3.1 compete em pé de igualdade com modelos líderes, como GPT-4o, Claude 3.5 Sonnet e Gemini Ultra, consolidando sua posição como o lançamento mais poderoso da Meta até hoje. Antes do lançamento oficial, resultados de benchmark foram vazados na comunidade tecnológica, gerando discussões e reconhecimento das impressionantes capacidades do Llama 3.1.
A Meta também publicou um abrangente artigo técnico de 92 páginas, detalhando o desenvolvimento e o treinamento do Llama 3.1, que foi treinado usando mais de 150 trilhões de tokens e 16.000 GPUs NVIDIA H100. Para garantir a estabilidade do treinamento, a Meta utilizou exclusivamente a arquitetura do modelo Transformer, evitando o atualmente popular modelo de mistura de especialistas (MoE).
Após o lançamento do Llama 3.1, a Meta estabeleceu parcerias com várias empresas para fomentar um ecossistema mais amplo. Empresas como Amazon, Databricks e NVIDIA começaram a oferecer suporte para auxiliar desenvolvedores na otimização e treinamento de seus modelos. Na China, o Tencent Cloud integrou o Llama 3.1 em sua plataforma TI, realizando ajustes e testes correspondentes.
Zuckerberg destacou a importância do código aberto, afirmando que isso capacita desenvolvedores a manterem o controle sobre seus modelos, assegura a segurança dos dados e reduz os custos de desenvolvimento. Para a Meta, o código aberto é essencial para manter a competitividade tecnológica. Ele enfatizou que um ecossistema aberto permitiria que mais pessoas se beneficiassem da tecnologia de IA, evitando a concentração de tecnologia em poucas corporações.
À medida que gigantes da tecnologia continuam a investir pesadamente no setor de IA, a Meta está mudando estrategicamente seu foco do metaverso para a IA, planejando ajustar o orçamento de sua divisão Reality Labs para apoiar uma equipe mais ampla em IA generativa. Da mesma forma, a Alphabet, empresa-mãe do Google, reafirmou seu compromisso com investimentos em IA em relatórios financeiros, indicando que grandes empresas estão competindo por inovações e avanços nesse cenário feroz.
Com o lançamento do Llama 3.1, a competição na tecnologia de IA de código aberto deve se intensificar, enquanto as principais empresas de tecnologia buscam navegar o futuro do desenvolvimento neste campo.