Aujourd'hui, nous assistons à un moment crucial dans le développement de l'IA avec le lancement de Llama 3, le dernier modèle de langage à grande échelle (LLM) de Meta Platforms, la société mère de Facebook, Instagram, WhatsApp et Oculus VR. Ce modèle est présenté comme l'un des systèmes d'IA open-source les plus puissants disponibles, faisant son apparition peu après une fuite précoce sur le service cloud Azure de Microsoft.
La première gamme de Llama 3 comprend deux versions : un modèle de 8 milliards de paramètres et un autre de 70 milliards de paramètres, qui font référence à la complexité des connexions entre neurones artificiels. Meta forme également un modèle de 400 milliards de paramètres, bien qu'aucune date de sortie n'ait été annoncée. Selon Ragavan Srinivasan, VP Produit chez Meta, les performances de ces modèles sont exceptionnelles, affichant des capacités de référence qui rivalisent avec celles des grands concurrents.
Actuellement, les modèles Llama 3 de 8B et 70B surpassent ou dépassent nettement les modèles concurrents de Google (Gemini Pro 1.5), Anthropic (Claude 3) et Mistral (7B Instruct) dans différentes tâches. En particulier, Llama 3 excelle dans les questions à choix multiples et les tâches de codage, tout en étant moins performant dans des domaines spécifiques comme les problèmes de mathématiques et les quiz de niveau universitaire. Néanmoins, la version 8B surpasse constamment les autres modèles sur les questions de mathématiques de niveau élémentaire.
Llama 3 de Meta ne se contente pas de briller dans les benchmarks ; il est également à l'origine d'un nouveau chatbot AI autonome, accessible en ligne sur www.meta.ai. Ce chatbot entre directement en concurrence avec ChatGPT d'OpenAI, Claude 3 d'Anthropic, et HuggingChat de HuggingFace. Comme l'a déclaré Mark Zuckerberg, « Meta AI est l'assistant IA le plus intelligent que vous pouvez utiliser librement. »
Le chatbot Meta AI propose une interface de dialogue conviviale et peut être utilisé sans connexion Facebook, bien que certaines fonctionnalités puissent être limitées au départ. Il inclut un modèle de génération d'images intégré, Meta Imagine, permettant de créer des images en quasi temps réel à partir des requêtes des utilisateurs. Pour utiliser cette fonctionnalité, les utilisateurs devront se connecter avec leur compte Facebook.
Contrairement à certaines autres plateformes, la génération d'images de Meta Imagine ne permet pas actuellement d'ajuster le format des images générées, mais elle offre un filigrane unique indiquant l'IA comme source. Les utilisateurs peuvent voir le processus de création d'image en direct et le rejouer sous forme d'animation ou de GIF.
Meta AI tire également des informations en direct à la fois de Bing de Microsoft et des résultats de recherche de Google, améliorant sa capacité à fournir des réponses actualisées. Cependant, la version actuelle de Llama 3 manque de fonctionnalités multimodales, ce qui signifie que les utilisateurs ne peuvent pas télécharger d'images ou de documents pour analyse, mais Meta prévoit d'y remédier dans les futures mises à jour.
Une caractéristique clé du statut open-source de Llama 3 est qu'il fonctionne sous une licence spécifique à Meta, similaire à celle de son prédécesseur, Llama 2. Bien que les entreprises tiers puissent utiliser Llama à des fins commerciales, celles ayant plus de 700 millions d'utilisateurs actifs mensuels doivent demander une licence à Meta, une situation qui a suscité des critiques au sein de la communauté open-source en raison de son impact potentiel sur la concurrence.
Concernant les améliorations, Llama 3 présente des taux de refus faux réduits, un meilleur alignement et une plus grande diversité dans les réponses par rapport à Llama 2. Ce progrès est le résultat d'un processus de formation complet utilisant une stratégie de parallélisation en trois volets, qui a triplé l'efficacité de l'entraînement. Llama 3 a été formé sur plus de 15 trillions de jetons, ce qui représente une augmentation septuple par rapport à Llama 2.
La version 70B propose également une fenêtre de contexte de 8 000 jetons, presque le double de celle de son prédécesseur, permettant des invites plus longues et une saisie d'informations plus complète. Llama 3 est actuellement disponible en téléchargement sur le site web AI de Meta et est hébergé sur des plateformes comme AWS, Google Cloud et Microsoft Azure.
Pour plus d'informations sur Llama 3, visitez le site officiel de l'IA de Meta.