微軟正在透過推出兩款全新自家芯片來強化其計算基礎設施,名為 Azure Maia 100 和 Azure Cobalt 100。
這些芯片於 2023 年微軟 Ignite 大會上在西雅圖揭幕,旨在為企業提供高效、可擴展且可持續的計算解決方案,以利用最新的雲技術和人工智慧的進步。
Azure Maia 100 作為微軟的 AI 加速器,專為基於雲的生成式 AI 工作負載的訓練和推理而設計;而 Azure Cobalt 100 則是一款以 Arm 為基礎的芯片,針對通用工作負載進行優化,重點提升效率。這兩款芯片將整合入 Azure 生態系,首先在微軟自家的數據中心中啟用,支持 Copilot 和 Azure OpenAI 服務。
微軟雲端與 AI 組的執行副總裁斯科特·古斯里(Scott Guthrie)強調,公司致力於優化基礎設施的每一層,以提升性能、多元化供應鏈,並為客戶提供靈活的基礎設施選擇。
那麼我們可以期待 Azure Maia 和 Cobalt 會帶來什麼呢?
雖然具體的性能指標尚未公開,但 Maia AI 芯片旨在處理微軟 Azure 上一些最大的 AI 工作負載,涵蓋從訓練高級語言模型到執行推理任務。其架構專為 Azure 硬體堆疊量身打造,以確保在需求高的工作負載下進行最佳利用。
微軟在與 OpenAI 的合作中開發了 Maia 芯片,並根據對 OpenAI 模型測試的反饋進行設計調整。OpenAI 首席執行官薩姆·奧特曼(Sam Altman)指出,這一合作在推動 Azure 的 AI 能力和降低客戶成本方面具有重要影響。
至於 Cobalt,雖然細節仍有限,但明顯這款芯片將專注於能效高的通用工作負載。凭藉其基於 Arm 的架構,Cobalt 被設計為每瓦特最大化性能,從而為每單位消耗的能源提供更多的計算能力。
微軟硬體產品開發的副總裁韋斯·麥卡洛(Wes McCullough)指出,這一架構設計優先考慮能效,可能會在微軟的數據中心中產生顯著的整體增益。
這兩款芯片將安裝在定制的伺服器板上,並放置在專門設計的機架中,以確保與現有數據中心的無縫整合。Maia 機架設有創新的「側邊伴侶」,能循環冷卻液,以防止在高功率使用期間過熱。
此外,微軟正在擴展其合作夥伴整合,推出新款 NC H100 v5 虛擬機系列的預覽,旨在支持 Nvidia H100 Tensor Core GPU,並計劃在 Azure 上增添 Nvidia H200 GPU 和 AMD MI300X 加速虛擬機以增強 AI 工作負載處理。
這一策略為微軟客戶提供多種針對其性能及成本需求的選擇。新芯片預計於 2024 年推出,同時第二代開發已在進行中。