Llama 3 se lanza con la presentación del nuevo chatbot de inteligencia artificial independiente de Meta.

Hoy marca un momento significativo en el desarrollo de la inteligencia artificial con el lanzamiento de Llama 3, el último modelo de lenguaje de gran tamaño (LLM) de Meta Platforms, la empresa matriz de Facebook, Instagram, WhatsApp y Oculus VR. Este modelo se presenta como uno de los sistemas de IA de código abierto más potentes disponibles, debutando poco después de una filtración temprana en el servicio de nube de Microsoft, Azure.

La línea inicial de Llama 3 incluye dos versiones: un modelo de 8 mil millones de parámetros y otro de 70 mil millones de parámetros, que indican la complejidad de las conexiones entre neuronas artificiales. Meta también está entrenando activamente una versión de 400 mil millones de parámetros, aunque aún no se ha anunciado una fecha de lanzamiento. Según Ragavan Srinivasan, vicepresidente de Producto de Meta, el rendimiento de estos modelos es excepcional, mostrando capacidades de referencia que rivalizan con las de competidores destacados.

Actualmente, los modelos Llama 3 de 8B y 70B muestran un rendimiento que supera o se adelanta significativamente a modelos competidores de Google (Gemini Pro 1.5), Anthropic (Claude 3) y Mistral (7B Instruct) en diversas tareas. En particular, Llama 3 brilla en preguntas de opción múltiple y tareas de programación, aunque presenta limitaciones en áreas específicas como problemas de matemáticas y cuestionarios a nivel de posgrado. Sin embargo, la versión de 8B supera consistentemente a otros modelos en preguntas de matemáticas de escuela primaria.

Llama 3 no solo causa sensación en los benchmarks; también es la base de un nuevo chatbot de IA independiente de Meta disponible en www.meta.ai. Este chatbot compite directamente con ChatGPT de OpenAI, Claude 3 de Anthropic y HuggingChat de HuggingFace. Como afirmó Mark Zuckerberg, "Meta AI es el asistente de IA más inteligente que puedes usar libremente".

El chatbot de Meta AI ofrece una interfaz de diálogo fácil de usar y se puede acceder sin necesidad de iniciar sesión en Facebook, aunque la funcionalidad puede ser limitada al principio. Incluye un modelo de generación de imágenes integrado, Meta Imagine, que permite la creación de imágenes casi en tiempo real según las instrucciones del usuario. Para utilizar esta función, los usuarios deberán iniciar sesión con sus cuentas de Facebook.

A diferencia de algunas otras plataformas, la generación de Meta Imagine no permite actualmente ajustes en la relación de aspecto de las imágenes generadas, pero ofrece una marca de agua única que indica la generación por IA. Los usuarios pueden observar el proceso de creación de imágenes en vivo y reproducirlo en forma de animación o GIF.

Meta AI también obtiene información en tiempo real de los resultados de búsqueda de Bing de Microsoft y Google, lo que mejora su capacidad para ofrecer respuestas actualizadas. Sin embargo, la versión actual de Llama 3 carece de funcionalidad multimodal, lo que significa que los usuarios no pueden subir imágenes o documentos para análisis, aunque Meta planea abordar esto en futuras actualizaciones.

Una distinción clave del estado de código abierto de Llama 3 es que opera bajo una licencia específica de Meta, similar a su predecesor, Llama 2. Mientras que las empresas de terceros pueden utilizar Llama con fines comerciales, aquellas con más de 700 millones de usuarios activos mensuales deben solicitar una licencia a Meta. Esto ha generado críticas de la comunidad de código abierto, ya que puede limitar la competencia.

En cuanto a las mejoras, Llama 3 presenta tasas de rechazo falso reducidas, mejor alineación y mayor diversidad en las respuestas en comparación con Llama 2. Esta mejora surge de un proceso de entrenamiento integral que utiliza una estrategia de paralelización en tres frentes, lo que aumentó la eficiencia del entrenamiento en tres veces. Llama 3 ha sido entrenado con más de 15 billones de tokens, un aumento de siete veces en comparación con Llama 2.

La versión de 70B también cuenta con una ventana de contexto de 8,000 tokens, casi el doble que su predecesor, lo que permite solicitudes más largas y una entrada de información más completa. Llama 3 ya está disponible para descargar en el sitio web de IA de Meta y se está alojando en plataformas como AWS, Google Cloud y Microsoft Azure.

Para más información sobre Llama 3, visita el sitio web oficial de IA de Meta.

Most people like

Find AI tools in YBX