Intel a dévoilé son nouveau processeur AI de génération suivante, l'accélérateur AI Gaudi 3, conçu pour améliorer le développement de l'IA en rationalisant les flux de travail, en simplifiant l'infrastructure et en accélérant les charges de travail des entreprises.
Le Gaudi 3 conserve l'architecture de son prédécesseur, mais offre des performances nettement améliorées : quatre fois plus de puissance de calcul, le double de la bande passante réseau et 1,5 fois la capacité de mémoire à large bande (HBM). Cela lui permet de gérer les demandes croissantes des modèles de langage de grande taille (LLM) sans compromettre les performances.
Initialement basé sur la technologie des unités de traitement graphique (GPU), le Gaudi 3 bénéficie de capacités de traitement parallèle et d'une architecture multi-carreaux qui en font un accélérateur AI particulièrement adapté. Ce lancement s'inscrit dans la stratégie d'Intel pour se mesurer à Nvidia et AMD sur le marché des accélérateurs AI.
Le PDG d’Intel, Patrick Gelsinger, a présenté le Gaudi 3 lors de l'événement AI Everywhere et a annoncé que bien que le lancement officiel ait lieu aujourd'hui, sa disponibilité générale est prévue pour le troisième trimestre de 2024, certains clients ayant déjà reçu des échantillons.
Selon Jeni Barovian, vice-présidente des solutions AI pour centres de données chez Intel, « l'IA générative représente une transformation fondamentale du calcul ». Elle a souligné que le Gaudi 3 offrira les performances, l'évolutivité et l'efficacité nécessaires à la construction des systèmes d'IA de demain.
Intel Gaudi 3 : spécifications et performances
Eitan Medina, COO des Habana Labs d'Intel, décrit le Gaudi 3 comme doté d'une architecture informatique hétérogène incluant 64 cœurs de processeur Tensor (5e génération), 8 moteurs mathématiques matriciels, 128 Go de capacité HBM avec une bande passante de 3,7 To/s, et 24 ports Ethernet RoCE de 200 GbE.
Construire des solutions avec le Gaudi 3 se veut aussi simple qu'avec le Gaudi 2. Intel a doublé la bande passante réseau par accélérateur, permettant des configurations de clusters étendues en fonction des besoins en charge de travail, qu'il s'agisse d'inférence, de fine-tuning ou d'entraînement.
Comparaison avec les GPU Nvidia
Comparé au H100 de Nvidia — un GPU de premier plan pour l'entraînement de modèles de langage comme Llama 2 et GPT-3 — le Gaudi 3 devrait être jusqu'à 1,7 fois plus rapide pour les tâches d'entraînement. Dans des tests d'inférence avec des modèles comme Llama-7B et Falcon 180B, le Gaudi 3 performances 1,5 fois plus rapide que le H100 et 1,3 fois plus rapide que le H200. Notamment, le Gaudi 3 affiche un taux d'efficacité énergétique jusqu'à 2,3 fois supérieur à celui du H100 en inférence.
Large gamme de produits
Intel ne lance pas seulement le chip Gaudi 3, mais aussi trois produits complémentaires :
1. Carte accélératrice AI Gaudi 3 (HL-325L) : conforme OAM avec 1,835 TFLOPS et 128 Go HBM2e.
2. Carte de base universelle (HLB-325) : offre 14,6 PFLOPS et plus de 1 To HBM2e.
3. Carte d'extension PCI Express : caractérisée par un design à double emplacement et un refroidissement passif, avec des performances comparables à ses homologues.
L’avenir de l’IA dans les entreprises
Le Gaudi 3 d'Intel répond aux préoccupations des entreprises, Sachin Katti, vice-président senior du réseau et du groupe edge, affirmant que nous entrons dans une ère d'agents IA capables de gérer de manière autonome des flux de travail complexes. La prochaine phase de l'IA verra ces agents tirer parti de données propriétaires, ouvrant la voie à une transformation significative dans divers secteurs.
Katti souligne le défi d'intégrer des données propriétaires non structurées dans les systèmes d'IA, qui restent souvent dépendants des CPU et dispersés à travers divers formats. Il plaide pour un écosystème modulaire et sécurisé où les entreprises peuvent choisir parmi une gamme de solutions AI compatibles, se concentrant sur un déploiement responsable pour garantir la fiabilité et atténuer les biais.
Intel vise à tirer parti des capacités améliorées du Gaudi pour attirer des clients loin de l'écosystème Nvidia, surtout avec la montée des coûts de l'intelligence artificielle. Avec un marché des puces AI en forte croissance projetée, Intel se positionne comme une alternative viable, mettant l'accent sur une approche ouverte et collaborative pour les solutions AI.
Conclusion
Alors que l'IA générative marque un tournant dans le domaine de l'informatique, le Gaudi 3 d'Intel introduit des performances compétitives et une efficacité visant à transformer le déploiement de l'IA dans les entreprises. L'engagement de la société envers des normes ouvertes et la compatibilité des systèmes souligne sa détermination à soutenir un paysage AI en évolution, promettant de répondre aux attentes des entreprises diversifiées cherchant à exploiter la puissance de l'IA.