微软正在通过推出两款新内置企业芯片来提升其计算基础设施:Azure Maia 100和Azure Cobalt 100。这些芯片在西雅图举行的微软Ignite 2023大会上亮相,旨在为企业提供高效、可扩展和可持续的计算解决方案,以利用云技术和人工智能的最新进展。
Azure Maia 100是微软的人工智能加速器,特别设计用于云端生成AI工作负载的训练和推理。相对而言,Azure Cobalt 100是一款基于Arm架构的芯片,专注于通用工作负载的高效处理。这两款芯片将整合进Azure生态系统,首先在微软自有的数据中心中部署,并且支持Copilot和Azure OpenAI服务。
微软云与AI集团执行副总裁Scott Guthrie强调,公司致力于优化基础设施的各个层面,以提高性能,丰富供应链,提供灵活的基础设施选择。
关于Azure Maia和Cobalt,我们可以期待什么?虽然具体性能指标尚未公布,但Maia AI芯片设计用于处理微软Azure上的大型AI工作负载,包括训练高级语言模型和执行推理任务。其架构经过专门优化,以确保在高负载工作中表现出色。
Maia芯片由微软与OpenAI合作开发,设计过程中参考了OpenAI模型的测试反馈。OpenAI首席执行官Sam Altman指出,双方合作在提升Azure AI能力和降低客户成本方面产生了积极影响。
至于Cobalt,尽管细节仍然有限,但这款芯片显然专注于在Azure上实现能效高的通用工作负载。Cobalt基于Arm架构,旨在最大化每瓦性能,为每消耗单位的能量提供更强的计算能力。微软硬件产品开发公司副总裁Wes McCullough强调其架构设计优先考虑电源效率,可能为微软的数据中心带来显著的整体提升。
这两款芯片将在定制的服务器板上安装于特殊设计的机架内,确保与现有数据中心的无缝集成。Maia机架采用创新的“侧翼”设计,能够循环冷却液以防止高功耗使用下过热。
此外,微软正在扩展其合作伙伴整合,推出新款NC H100 v5虚拟机系列的预览版,旨在支持Nvidia H100 Tensor Core GPU,并计划在Azure上增加Nvidia H200 GPU和AMD MI300X加速虚拟机,以增强AI工作负载处理能力。这一策略为微软客户提供多种根据性能和成本需求量身定制的选择。这些新芯片预计将在2024年推出,同时第二代产品的开发已在进行中。