英特爾推出了下一代人工智慧處理晶片——Gaudi 3 AI 加速器,旨在透過簡化工作流程、簡化基礎設施和加速企業工作負載來推進人工智慧的發展。Gaudi 3 保留了前身的架構,但性能顯著提升:計算能力提升四倍,網絡帶寬翻倍,以及高帶寬記憶體(HBM)容量增至1.5倍,使其能在不妥協性能的情況下處理大型語言模型(LLM)的日益増長需求。
Gaudi 3 的平行處理能力和多塊架構源於圖形處理單元(GPU)技術,非常適合作為人工智慧加速器。此次發布是英特爾在人工智慧加速器市場上與Nvidia和AMD競爭策略的一部分。英特爾首席執行官帕特里克·蓋辛格(Patrick Gelsinger)在 AI Everywhere 活動上展示了 Gaudi 3,並宣布該晶片今天正式推出,預計在2024年第三季度全面上市,部分客戶已經收到樣品。
根據英特爾數據中心人工智慧解決方案的副總裁珍妮·巴羅維安(Jeni Barovian)的說法,「生成型人工智慧代表了計算的基礎性轉變。」她強調 Gaudi 3 將提供構建未來人工智慧系統所需的性能、可擴展性和效率。
英特爾 Gaudi 3:規格與性能
英特爾哈巴納實驗室(Habana Labs)首席運營官艾頓·梅迪納(Eitan Medina)形容 Gaudi 3 擁有異構計算架構,包括64個第五代張量處理器核心、8個矩陣數學引擎、128GB HBM容量及3.7 TB/s帶寬,以及24個200 GbE RoCE以太網端口。利用 Gaudi 3 構建解決方案與使用 Gaudi 2 同樣簡單。英特爾將每個加速器的網絡帶寬提高了一倍,允許根據需要進行大量集群配置,不論是推斷、微調還是訓練。
與Nvidia GPU的比較
與Nvidia的H100相比,Gaudi 3 在訓練大型語言模型(如 Llama 2 和 GPT-3)時的速度預計快達1.7倍。在使用 Llama-7B 和 Falcon 180B 進行推斷測試時,Gaudi 3 的性能報告顯示比H100快1.5倍,比更新的H200快1.3倍。值得注意的是,Gaudi 3在推斷任務中的能效比H100高出最多2.3倍。
廣泛的產品系列
英特爾不僅推出了 Gaudi 3 晶片,還推出了三款互補產品:
1. Gaudi 3 AI 加速器卡(HL-325L):符合OAM標準,具備1,835 TFLOPs和128 GB HBM2e。
2. 通用基板(HLB-325):提供14.6 PFLOPS和超過1 TB HBM2e。
3. PCI Express 增強卡:具備雙插槽,被動冷卻設計,性能指標與其同類產品相當。
企業 AI 的未來
英特爾的 Gaudi 3 針對企業級需求,網絡與邊緣業務部高級副總裁薩欽·卡提(Sachin Katti)強調,我們正在進入一個人工智慧代理可以自主處理複雜工作流程的時代。人工智慧的下一個階段將看到這些代理利用專有數據,為各行業的重大轉型奠定基礎。
卡提指出,將非結構化的專有數據整合進人工智慧系統是一大挑戰,這些系統往往仍依賴CPU,且數據格式分散。他提倡建立一個模組化、靈活的安全生態系統,讓企業可以選擇各種兼容的人工智慧解決方案,並專注於負責任的部署,以確保可信性和降低偏見。
英特爾旨在利用 Gaudi 的增強能力,吸引客戶擺脫Nvidia生態系統,尤其是在人工智慧成本上升的背景下。隨著人工智慧晶片市場的預期增長,英特爾正定位為一個可行的替代方案,強調其對開放與協作的人工智慧解決方案的承諾。
結論
當生成型人工智慧標誌著計算的一個關鍵時刻時,英特爾的 Gaudi 3 以競爭性能和效率引領企業人工智慧部署的轉型。該公司對開放標準及系統兼容性的承諾,突顯了其支持不斷演變的人工智慧生態系統的決心,預示著將為各種尋求利用人工智慧力量的企業需求提供解決方案。