Meta lanzó recientemente Llama 3.1, presentado como el "modelo fundamental de código abierto más potente" disponible en la actualidad. Según un comunicado oficial, este lanzamiento marca un momento crucial en el avance de los modelos grandes de código abierto, el inicio de una nueva era en la inteligencia artificial (IA).
La serie Llama ha estado a la vanguardia de los modelos de código abierto, con Meta junto a OpenAI representando el futuro de las tecnologías tanto abiertas como propietarias. Durante la presentación de Llama 3.1, el CEO de Meta, Mark Zuckerberg, enfatizó la importancia del código abierto para promover una evolución positiva de la IA, anunciando planes para establecer la IA de código abierto como estándar de la industria.
Llama 3.1 está disponible en tres tamaños de parámetros: 8B, 70B y 405B, adaptándose a diversas aplicaciones como agentes multilingües, razonamiento complejo y asistencia en programación. El modelo cuenta con una ventana de contexto ampliada de 128K, un aumento significativo respecto a los 8K anteriores, y soporta múltiples idiomas, incluyendo inglés, alemán y francés. Además, presenta capacidades de herramientas mejoradas, permitiendo integración con motores de búsqueda y razonamiento matemático a través de Wolfram Alpha, todo mientras ofrece un modelo de licencia más flexible que permite a los usuarios optimizar otros modelos de lenguaje grande (LLMs) utilizando Llama 3.1.
Las evaluaciones de referencia indican que el modelo de 405B de Llama 3.1 compite al mismo nivel que modelos líderes como GPT-4o, Claude 3.5 Sonnet y Gemini Ultra, afirmando su posición como el lanzamiento más poderoso de Meta hasta la fecha. Antes del lanzamiento oficial, los resultados de referencia se filtraron en la comunidad tecnológica, generando amplias discusiones y reconocimiento de las impresionantes capacidades de Llama 3.1.
Meta también publicó un exhaustivo documento técnico de 92 páginas que detalla el desarrollo y entrenamiento de Llama 3.1, que fue entrenado utilizando más de 150 billones de tokens y 16,000 GPUs NVIDIA H100. Para asegurar la estabilidad del entrenamiento, Meta utilizó exclusivamente la arquitectura de modelo Transformer, evitando el actualmente popular modelo de mezcla de expertos (MoE).
Tras el lanzamiento de Llama 3.1, Meta se asoció rápidamente con varias empresas para fomentar un ecosistema más amplio. Compañías como Amazon, Databricks y NVIDIA han comenzado a ofrecer apoyo para ayudar a los desarrolladores en el ajuste y entrenamiento de sus modelos. En China, Tencent Cloud ha integrado Llama 3.1 en su plataforma TI, realizando el ajuste y las pruebas correspondientes.
Zuckerberg destacó que la importancia del código abierto reside en que empodera a los desarrolladores para mantener el control sobre sus modelos, asegura la seguridad de los datos y reduce los costos de desarrollo. Para Meta, el código abierto es vital para mantener la competitividad tecnológica. Subrayó que un ecosistema abierto permitiría a más personas beneficiarse de la tecnología de IA, evitando la concentración tecnológica en unas pocas corporaciones.
A medida que los gigantes tecnológicos continúan invirtiendo fuertemente en el sector de la IA, Meta está cambiando estratégicamente su enfoque del metaverso a la IA, planeando ajustar el presupuesto de su división Reality Labs para apoyar a un equipo más amplio de IA generativa. De igual manera, Alphabet, la empresa matriz de Google, ha reiterado su compromiso con la inversión en IA en informes financieros, indicando que las grandes compañías compiten por la innovación y avances en este intenso panorama de IA.
Con el lanzamiento de Llama 3.1, la competencia en tecnología de IA de código abierto está a punto de intensificarse, a medida que las principales empresas tecnológicas buscan navegar en el futuro de este desarrollo.