在今天发布的一篇开创性研究论文中,英伟达的半导体工程师揭示了生成性人工智能(AI)如何简化半导体设计这一复杂过程。该研究展示了专业行业如何利用在专有数据上训练的大型语言模型(LLMs)开发AI驱动的助手,从而提升半导体制造的生产力。
该研究采用了英伟达的NeMo框架,展示了定制AI模型在半导体领域提供竞争优势的潜力。半导体设计任务极为复杂,涉及在3D电路图上精确配置含有亿万晶体管的芯片,这些电路图像比人类的头发还要细。这个过程需要不同工程团队之间的广泛协作,每个团队专注于设计的不同方面,并使用不同的软件工具和编程语言。
英伟达的芯片设计师开发了一种利用LLMs辅助半导体芯片创建的方法。研究的首席作者、英伟达研究总监Mark Ren表示:“我相信,随着时间的推移,大型语言模型将提升各个领域的工作流程。”
该论文由英伟达首席科学家Bill Dally在旧金山国际计算机辅助设计会议的主题演讲中介绍。Dally评论道:“这个项目是将LLMs应用于半导体设计复杂工作的重要第一步,展示了专业领域如何利用内部数据进行有效的生成性AI模型训练。”
英伟达团队创建了一个名为ChipNeMo的定制LLM,使用公司内部数据来生成和优化软件,同时辅助设计人员。它们的长期目标是将生成性AI应用于芯片设计的各个阶段,以显著提升生产力。初期应用包括聊天机器人、代码生成器和分析工具。
分析工具受到了积极反馈,成功自动化了维护更新的bug描述这一繁琐任务。此外,一个原型聊天机器人帮助工程师快速查找技术文档,而代码生成器则为芯片设计生成专用的软件代码片段。
该研究强调了团队在收集设计数据和创建适用于多个行业的定制生成性AI模型方面的努力。通过从基础模型出发,并利用英伟达的NeMo框架——一个用于构建、定制和部署生成性AI模型的工具——他们最终精炼出具备430亿个参数、基于超过一万亿个标记进行训练的ChipNeMo模型。该模型展现出卓越的模式识别能力。
研究表明,一个技术精湛的团队可以通过自身数据增强预训练模型,强调了定制大型语言模型的必要性,因为较小的模型在特定任务中可能胜过较大的一般性版本。在训练过程中,有效的数据收集和清理至关重要,用户应随时了解最新的工具,以优化其工作流程。
随着半导体行业开始探索生成性AI的潜力,这项研究提供了重要的见解。有意开发自己定制LLM的公司可以利用NeMo框架,这一资源可以在GitHub和英伟达NGC目录中找到。
该研究论文还包含了多位专家的贡献,包括Mingjie Liu、Teo Ene、Robert Kirby、Chris Cheng、Nathaniel Pinckney等人。