Arm宣布其Total Design生態系統在啟動一年內實現了規模的翻倍,顯著推進了全球在可持續性方面的矽創新。
數據中心面臨持續的挑戰,需在AI工作負載激增與電力需求之間取得平衡,同時還要應對晶片開發成本和複雜性的上升。在最近的一篇部落格文章中,Arm基礎設施業務副總裁Eddie Ramirez強調,Arm Total Design計劃旨在應對這些問題,透過促進一個專注於加速定制矽開發的合作夥伴生態系統。這項合作旨在利用Arm計算子系統(CSS)構建數據中心的未來解決方案。
該生態系統迅速發展為一個多供應商的Arm晶片和SoC環境,現已包括超過30家參與公司,其中包括Alcor Micro、Egis、PUF Security和SemiFive。
新型Arm解決方案為AI數據中心提供可持續支持
Arm Total Design促進了全球合作,產生了針對生成AI計算設計的真實CSS驅動解決方案。值得一提的是,Arm、Samsung Foundry、ADTechnology與Rebellions攜手推出了一個針對雲端、高性能計算及AI/ML工作負載的AI CPU晶片平臺。該平臺將Rebellions的Rebel AI加速器與來自ADTechnology的Neoverse CSS V3驅動計算晶片整合,並採用Samsung Foundry先進的2納米Gate-All-Around (GAA)製程技術進行生產。
這項合作承諾提供卓越的性能和最佳的能效,根據預測,使用Llama3.1 405B參數大語言模型進行生成AI工作負載時,可達到2x至3x的效率優勢。
“AI與高性能計算的設計需要提供最大性能、高晶體管密度和能源效率的技術解決方案。”三星電子晶圓代工業務發展負責人Taejoong Song表示。他對利用Arm CSS的靈活性和Arm Total Design生態系統推動超大規模計算與雲服務提供商的尖端技術採用感到興奮。
這一計劃展示了Arm Total Design及其基於標準的計算子系統如何通過整合Arm優化的EDA工具、全球設計專業知識和代工合作夥伴,加速AI矽的開發,為AI加速器設計者提供更簡單的整合方式。
隨著AI工作負載迅速演變,緊密耦合的CPU計算變得至關重要,以支持完整的AI堆疊。數據預處理、編排和數據庫增強技術,如檢索增強生成(RAG),均可利用Arm Neoverse CPU的性能效率。這些能力是CSS不可或缺的一部分,並且已在生態系統中受益。
為專用AI基礎設施建立新標準
Arm Total Design正在為可持續的AI數據中心建立堅實的硬體基礎。它正加速創建基於Arm的測試晶片和由Neoverse N系列或V系列CSS驅動的晶片產品。由於降低了進入門檻並擴大了對最新CSS工具的訪問,從雲端到邊緣的各種晶片解決方案正在迅速擴展。
最近,Alcor Micro宣布計劃開發一款旨在AI/ML訓練和推斷的晶片,該晶片將由CSS驅動。同樣,Alphawave透露其建基於CSS的先進計算晶片,設計用於AI/ML、高性能計算、數據中心及5G/6G應用。這些Arm 基礎的晶片展示了Arm夥伴關係所提供的靈活性、多樣性和全球供應鏈能力。
此外,像Alphawave、Cadence和proteanTecs等夥伴正在驗證其在先進節點上使用CSS的第三方IP產品,以確保符合Arm規範。這意味著夥伴可以在最先進的節點上構建基於CSS的定制矽,並享受無縫的軟體體驗。
軟體準備對釋放AI潛力至關重要。30多年來,Arm一直致力於確保Arm平台上的軟體可靠運行。如今,所有主要框架和操作系統均與Arm兼容,使得Arm Total Design生態系統中多樣的矽解決方案能受益於充滿活力的軟體環境。
這項投資的代表性例子是Arm Kleidi技術的推出,該技術針對PyTorch和Llama.cpp等開源項目優化了基於CPU的推斷。這一優化對於正開發基於CSS的邊緣AI計算晶片的Arm Total Design夥伴特別有價值,無需加速器支持。