IBM 正在利用人腦的力量創新其人工智慧硬體設計,最近推出了 NorthPole 晶片。這款先進的晶片在延遲和能效方面超越傳統的 GPU,顯示出人工智慧領域的重大進展。
NorthPole 晶片採用專為神經推理任務(如圖像分類和物體檢測)優化的 12 奈米架構。根據近期發表於《科學》期刊的研究,NorthPole 在 ResNet50 基準測試中達到驚人的 25 倍能效,並具有 22 倍更低的延遲。它由 220 億個晶體管組成,擁有豐富的片上記憶體,能直接在晶片上進行運算,顯著減少對外部記憶體的需求,提升整體速度和效率。
NorthPole 晶片的一項關鍵創新是其自給自足的特性,類似於人腦。IBM 的溝通中指出,“設備的記憶體完全在晶片上,而不是單獨連接。”這種設計消除了記憶體與處理單元之間不斷數據轉移的需求,有效避免了經常阻礙性能的馮·諾依曼瓶頸。
“NorthPole 晶片實際上相當於一個完整的網路集成在單一晶片上,”IBM 人腦啟發計算首席科學家兼該技術的主要開發者 Dharmendra Modha 解釋道。值得注意的是,NorthPole 的性能甚至超越了使用更尖端製程(如 4 奈米 GPU)製造的晶片。
技術的極限
儘管 IBM 計劃對 NorthPole 進行迭代,包括在 2 奈米節點上進行實驗——這比現有的 3 奈米 CPU 更先進,這款新晶片仍然存在一些限制。特別是,它無法訪問外部記憶體,因此無法直接運行更大型的神經網絡。相反,它通過將較大的網絡劃分為較小的部分,在多個 NorthPole 晶片間連接這些“子網絡”來解決此挑戰。Modha 將這個技術稱為“擴展”,以實現高效處理。
“我們不能在這款晶片上運行 GPT-4,但它完全可以支持多種企業級模型。”Modha 表示。NorthPole 專為推理任務而設計,對於需要實時處理大量數據的邊緣應用—特別是在自駕車技術等領域—來說,具有廣泛的前景。
腦啟發設計
NorthPole 的架構受到人腦結構和功能的啟發。其片上網絡(NoCs)促進了處理核心間的通信,進一步增強了計算和記憶體分配。IBM 的研究人員將這些通道比作大腦的白質和灰質連結,使數據在神經回路中流動更加高效。
此外,NorthPole 旨在模仿大腦突觸的精確度,使用 2 至 4 位的低位元精度,而傳統 GPU 通常使用 8 至 16 位。這種策略選擇大幅降低了記憶體和功耗需求,進一步提升了晶片的效率。
未來展望
IBM 仍處於探索 NorthPole 晶片潛力的早期階段,目前正在進行各種應用的研究。最初,該晶片主要用於計算機視覺任務,與美國國防部的資助相符。目前專注於檢測、圖像分割和視頻分類等應用。
此外,NorthPole 也在自然語言處理和語音識別等其他領域進行試驗。開發團隊目前正在研究將僅解碼的大型語言模型映射到 NorthPole 的擴展系統上的機會,為在各個行業中利用這項尖端技術開辟了新的可能性。