오늘 발표된 혁신적인 연구 논문에서 Nvidia의 반도체 엔지니어들은 생성적 인공지능(AI)이 반도체 설계의 복잡한 과정을 어떻게 간소화할 수 있는지를 밝혔다. 이 연구는 전문 산업들이 독점 데이터로 훈련된 대형 언어 모델(LLMs)을 활용하여 AI 기반 보조 도구를 개발하고, 반도체 제조의 생산성을 향상시킬 수 있음을 보여준다.
연구는 Nvidia NeMo를 활용하여 맞춤형 AI 모델이 반도체 분야에서 경쟁 우위를 제공할 수 있는 가능성을 입증했다. 반도체 설계는 수십억 개의 트랜지스터가 도시 배치와 유사한 3D 회로도에 정확하게 배치되는 복잡한 작업으로, 인간 머리카락보다 얇은 구조를 요구한다. 이는 각기 다른 설계 측면에 집중하며, 다양한 소프트웨어 도구와 프로그래밍 언어를 사용하는 여러 엔지니어 팀 간의 광범위한 협업을 필요로 한다.
Nvidia의 칩 설계자들은 LLMs를 반도체 칩 생성에 활용하는 방법을 개발했다. 연구 책임자이자 Nvidia의 연구 이사인 마크 렌은 “시간이 지남에 따라 대형 언어 모델이 전반적인 프로세스를 향상시킬 것”이라고 말했다. 이 논문은 샌프란시스코에서 열린 컴퓨터 보조 설계 국제 회의에서 Nvidia의 수석 과학자인 빌 달리의 기조 연설 중에 소개되었다. 달리는 “이 노력은 반도체 설계라는 복잡한 작업에 LLM을 적용하는 중요한 첫 걸음을 의미하며, 전문 분야가 내부 데이터를 효과적인 생성 AI 모델 훈련에 활용할 수 있는 방법을 보여준다”고 언급했다.
Nvidia 팀은 내부 데이터로 훈련된 맞춤형 LLM인 ChipNeMo를 만들어 소프트웨어를 생성하고 최적화하며 설계자들을 지원하게 했다. 그들의 장기 목표는 반도체 설계의 모든 단계에서 생성 AI를 구현하여 생산성을 크게 향상시키는 것이다. 초기 응용 프로그램으로는 챗봇, 코드 생성기, 분석 도구가 있다.
이 분석 도구는 업데이트된 버그 설명을 유지하는 지루한 작업을 자동화하여 긍정적인 피드백을 받았다. 또한 프로토타입 챗봇은 엔지니어들이 기술 문서를 신속하게 찾을 수 있도록 도와주며, 코드 생성기는 칩 설계를 위한 전문 소프트웨어 스니펫을 생성한다.
이 연구는 팀이 설계 데이터를 수집하고 다양한 산업에 적용할 수 있는 맞춤형 생성 AI 모델을 만들기 위해 헌신하고 있음을 강조한다. Nvidia NeMo라는 프레임워크를 활용해 기초 모델로 시작하여 최종 ChipNeMo 모델을 개선했으며, 이 모델은 430억 개의 매개변수를 가지고 있으며 1조 개 이상의 토큰으로 훈련되었다. 이 모델은 패턴 인식 능력이 뛰어나다.
이 연구는 기술적으로 숙련된 팀이 자사 데이터를 활용해 사전 훈련된 모델을 향상시킬 수 있음을 보여준다. 작은 모델이 더 크고 일반적인 버전을 능가할 수 있기 때문에 LLM의 맞춤화가 필요하며, 교육 과정에서 효과적인 데이터 수집 및 정리가 필수적이다. 사용자들은 워크플로우 최적화를 위한 최신 도구에 대한 정보를 지속적으로 확보하는 것이 권장된다.
반도체 산업이 생성 AI의 가능성을 탐색하기 시작하면서, 이 연구는 중요한 통찰을 제공한다. 맞춤형 LLM 개발에 관심이 있는 기업들은 GitHub와 Nvidia NGC 카탈로그에서 사용할 수 있는 NeMo 프레임워크를 활용할 수 있다. 이 연구 논문은 민지에 리우, 테오 에네, 로버트 커비, 크리스 챙, 네이선 필크니 등 다양한 전문가들의 기여를 포함하고 있다.