Microsoft renforce son infrastructure informatique avec le lancement de deux nouvelles puces internes pour les entreprises : Azure Maia 100 et Azure Cobalt 100.
Présentées lors de la conférence Microsoft Ignite 2023 à Seattle, ces puces visent à offrir aux entreprises des solutions informatiques efficaces, évolutives et durables, permettant de tirer parti des dernières avancées en matière de technologie cloud et d'IA.
La puce Azure Maia 100 agit comme un accélérateur d'IA, conçue spécifiquement pour l'entraînement et l'inférence de charges de travail génératives basées sur le cloud. D'autre part, l'Azure Cobalt 100 est une puce basée sur l'architecture Arm, optimisée pour des charges de travail générales, mettant l'accent sur l'efficacité énergétique. Ces deux puces seront intégrées dans l'écosystème Azure, en commençant par les propres centres de données de Microsoft, soutenant les services Copilot et Azure OpenAI.
Scott Guthrie, vice-président exécutif du groupe Cloud + AI de Microsoft, a souligné l'engagement de l'entreprise à optimiser chaque couche de son infrastructure pour améliorer les performances, diversifier sa chaîne d'approvisionnement et offrir aux clients des choix d'infrastructure flexibles.
Quelles attentes pour Azure Maia et Cobalt ? Bien que des indicateurs de performance précis ne soient pas encore disponibles, la puce Maia est conçue pour gérer certaines des plus grandes charges de travail d'IA sur Microsoft Azure, allant de l'entraînement de modèles de langage avancés à l'exécution de tâches d'inférence. Son architecture est adaptée à la pile matérielle Azure pour garantir une utilisation optimale durant les charges de travail exigeantes.
Microsoft a développé la puce Maia en collaboration avec OpenAI, affinant son design basé sur les retours d'expérience obtenus lors des tests avec les modèles d'OpenAI. Sam Altman, PDG d'OpenAI, a souligné l'impact de cette collaboration sur l'avancement des capacités d'IA d'Azure et la réduction des coûts pour les clients.
Concernant Cobalt, bien que les détails demeurent limités, il est clair que cette puce se concentrera sur les charges de travail générales à haute efficacité énergétique sur Azure. Avec son architecture Arm, Cobalt est conçu pour maximiser les performances par watt, offrant ainsi une puissance de calcul accrue pour chaque unité d'énergie consommée.
Wes McCullough, vice-président corporate du développement de produits matériels chez Microsoft, a noté que la conception architecturale priorise l'efficacité énergétique, ce qui pourrait entraîner des gains globaux significatifs dans les centres de données de Microsoft.
Les deux puces seront installées sur des cartes serveur personnalisées dans des racks spécialement conçus, garantissant une intégration sans faille dans les centres de données existants. Le rack Maia dispose d'innovants "sidekicks" qui font circuler un liquide froid pour éviter la surchauffe lors d'une utilisation à forte puissance.
De plus, Microsoft élargit ses intégrations de partenaires avec le lancement d'un aperçu de la nouvelle série de machines virtuelles NC H100 v5, conçue pour les GPU Nvidia H100 Tensor Core. Des plans sont également en cours pour inclure les GPU Nvidia H200 et les VMs accélérées AMD MI300X sur Azure, afin d'améliorer le traitement des charges de travail en IA.
Cette stratégie offre aux clients de Microsoft plusieurs options adaptées à leurs besoins en performance et en coûts. Les nouvelles puces devraient être lancées en 2024, avec le développement d'une seconde génération déjà en cours.