Ampere Computing Élargit Sa Famille de Processeurs et Met l'Accent sur l'Efficacité de l'IA
Ampere Computing a annoncé que sa famille de puces AmpereOne s'élargira à 256 cœurs d'ici l'année prochaine. La société collabore également avec Qualcomm pour développer des accélérateurs d'IA pour le cloud. Selon Jeff Wittich, directeur des produits, cette nouvelle unité centrale de traitement (CPU) offrira 40 % de performances supplémentaires par rapport à tout autre CPU disponible aujourd'hui.
Collaboration avec Qualcomm
Située à Santa Clara, en Californie, Ampere s'associe à Qualcomm Technologies pour créer une solution d'inférencing IA en tirant parti des solutions d'inférence Cloud AI 100 de Qualcomm, à faible consommation d'énergie, aux côtés des CPU Ampere. Renee James, PDG d'Ampere, a souligné les défis énergétiques pressants posés par les avancées en IA. "Nous avons commencé ce parcours il y a six ans car nous avons reconnu son importance," a déclaré James. "Une faible consommation d'énergie ne signifie plus une faible performance. Ampere a redéfini le front de l'efficacité de l'informatique, offrant une performance supérieure dans un cadre efficient."
Optimisation de l'Efficacité Énergétique des Centres de Données
La consommation d'énergie des centres de données est une préoccupation croissante. James a souligné que la transition rapide vers l'IA a intensifié les défis énergétiques de l'industrie. "La trajectoire actuelle n'est pas durable. Les infrastructures de centres de données futures doivent moderniser les installations climatisées existantes et construire de nouvelles installations respectueuses de l'environnement compatibles avec la disponibilité de l'énergie du réseau," a-t-elle affirmé. Wittich a soutenu ce point de vue, notant que le besoin d'un nouveau CPU était motivé par la consommation d'énergie croissante dans les centres de données, notamment en raison de l'IA. "Il est impératif de développer des solutions qui améliorent l'efficacité dans l'informatique générale et l'IA," a-t-il ajouté.
Vision d'Ampere pour l'Informatique IA
Ampere adopte une approche globale appelée "AI Compute", englobant des capacités cloud-native et des fonctionnalités d'IA. "Nos CPUs peuvent prendre en charge un large éventail de charges de travail allant des applications cloud-native populaires aux applications d'IA, intégrant l'IA dans des applications traditionnelles comme le traitement de données et la diffusion de médias," a expliqué Wittich.
Feuille de Route Future
Ampere a établi une feuille de route ambitieuse pour ses CPU de centres de données. Les développements clés à venir incluent le CPU à 256 cœurs avec 12 canaux, fabriqué avec la technologie TSMC N3. Le CPU à 192 cœurs, annoncé précédemment, est déjà en production et disponible sur le marché. Ampere et Qualcomm collaborent pour améliorer leur solution conjointe, intégrant les CPUs Ampere et le Qualcomm Cloud AI 100 Ultra, ciblant l'inférencing de modèles de langage de grande taille (LLM) en IA générative. Wittich a décrit leur partenariat comme un engagement à créer des CPUs hautement efficaces optimisés pour les applications d'IA. "Cette solution simplifiera l'adoption par les clients et offrira des capacités innovantes pour l'inférencing IA," a-t-il commenté.
Améliorations de Performance
Avec l'élargissement de la plateforme à 12 canaux pour inclure le nouveau CPU AmpereOne à 256 cœurs, les utilisateurs peuvent s'attendre à des gains de performance significatifs sans designs complexes. Le modèle existant à 192 cœurs est en bonne voie pour être lancé plus tard cette année, montrant une évolution de huit à douze canaux de mémoire. Notamment, la technologie CPU d'Ampere est déjà utilisée par Llama 3 de Meta sur Oracle Cloud. Fait remarquable, Llama 3 fonctionne sur le CPU Ampere Altra à 128 cœurs sans GPU, offrant une parité avec la combinaison d'un GPU Nvidia A10 et d'un CPU x86 tout en consommant seulement un tiers de l'énergie.
Groupe de Travail UCIe et Avantage Concurrentiel
Récemment, Ampere a formé un groupe de travail UCIe dans le cadre de l'AI Platform Alliance pour améliorer la flexibilité de ses processeurs, permettant l'intégration de la propriété intellectuelle des clients dans les conceptions futures. Ampere rivalise directement avec AMD, mettant en avant ses avantages en matière de performance. Les CPUs AmpereOne se distinguent par leur performance par watt, surpassant le Genoa d'AMD de 50 % et le Bergamo de 15 %. Pour les centres de données cherchant à moderniser leur infrastructure, AmpereOne peut offrir 34 % de performance en plus par serveur.
Les nouvelles plateformes OEM et ODM Ampere sont prévues pour être expédiées dans les mois à venir. De plus, Ampere a établi un partenariat avec NETINT pour développer une solution utilisant leurs puces de traitement vidéo Quadra T1U, permettant le transcoding simultané de 360 chaînes en direct et le sous-titrage en temps réel pour 40 flux, en utilisant le modèle Whisper d'OpenAI. Ampere vise à être l'épine dorsale de l'informatique à l'ère de l'IA. Les améliorations récentes, incluant des fonctionnalités telles que le Memory Tagging, l'application de QOS et la gestion de la congestion de réseau, culminent avec l'introduction de la fonctionnalité FlexSKU, permettant aux clients d'utiliser le même SKU pour des cas d'utilisation à grande échelle et à petite échelle.
En collaborant avec Oracle, Ampere a réussi à réduire les coûts opérationnels de 28 % tout en utilisant seulement un tiers de l'énergie requise par les solutions concurrentes de Nvidia. Cette approche permet aux utilisateurs de fonctionner avec 15 % de serveurs en moins, 33 % d’espace de rack réduit et 35 % de consommation d'énergie réduite, conformément à l'engagement d'Ampere envers l'efficacité et la performance dans l'informatique IA.