在今日發表的一項突破性研究中,Nvidia 的半導體工程師揭示了生成式人工智慧(AI)如何簡化複雜的半導體設計過程。該研究說明了專業行業如何利用基於專有數據訓練的大型語言模型(LLMs)來開發 AI 驅動的助手,提升半導體製造的生產力。
該研究使用了 Nvidia NeMo,展示了定制 AI 模型在半導體領域提供競爭優勢的潛力。半導體設計是一項複雜的任務,需要精確配置包含數十億個晶體管的芯片,這些晶片的 3D 電路圖看似城市平面圖,但厚度僅比一根人類頭髮薄。此過程需要多個工程團隊的廣泛協作,每個團隊專注於不同的設計層面,並使用不同的軟體工具和編程語言。
Nvidia 的晶片設計師開發了一種方法,利用 LLMs 協助半導體芯片的創建。研究主導作者 Mark Ren,Nvidia 的研究主任表示:“我相信隨著時間的推移,大型語言模型將提升各個方面的流程。”
該論文由 Nvidia 首席科學家 Bill Dally 在舊金山舉行的國際計算機輔助設計會議上發表。Dally 評論道:“這項工作標誌著將 LLM 應用於半導體設計複雜工作的重大第一步,展示了專業領域如何有效利用內部數據來進行生成式 AI 模型的訓練。”
Nvidia 團隊創建了一個名為 ChipNeMo 的定制 LLM,該模型基於公司的內部數據進行訓練,用於生成和優化軟件,同時協助設計師。他們的長期目標是將生成式 AI 應用於芯片設計的所有階段,顯著提高生產力。初步應用包括聊天機器人、代碼生成器和分析工具。
分析工具已獲得良好反饋,能自動維護更新的錯誤描述。此外,原型聊天機器人幫助工程師迅速定位技術文檔,而代碼生成器則為芯片設計創建專門的軟件片段。
此次研究強調了團隊對收集設計數據和創建適用於多個行業的定制生成式 AI 模型的承諾。團隊從基礎模型開始,利用 Nvidia NeMo——一個專門用於構建、定制和部署生成式 AI 模型的框架,精煉了最終的 ChipNeMo 模型,此模型擁有 430 億個參數,並在超過一兆個標記上進行訓練,展現出卓越的模式識別能力。
該研究示範了技術熟練的團隊如何用自身數據增強預訓練模型,強調了定制 LLM 的必要性,因為較小的模型可能超越大型通用模型。在訓練過程中,有效的數據收集和清理至關重要,並鼓勵用戶掌握最新的工具,以優化其工作流程。
隨著半導體行業開始探索生成式 AI 的能力,這項研究提供了關鍵見解。有興趣開發自定義 LLM 的公司可以利用 NeMo 框架,該框架在 GitHub 和 Nvidia NGC 目錄中可獲得。
該論文包括了多位專家的貢獻,包括 Mingjie Liu、Teo Ene、Robert Kirby、Chris Cheng、Nathaniel Pinckney 等人。