Em um artigo de pesquisa inovador divulgado hoje, os engenheiros de semicondutores da Nvidia revelaram como a inteligência artificial generativa (IA) pode simplificar o complexo processo de design de semicondutores. O estudo ilustra como indústrias especializadas podem utilizar modelos de linguagem de grande escala (LLMs) treinados com dados proprietários para desenvolver assistentes impulsionados por IA, aumentando a produtividade na fabricação de semicondutores.
A pesquisa utilizou o Nvidia NeMo, demonstrando o potencial de modelos de IA personalizados para oferecer uma vantagem competitiva no setor. O design de semicondutores é uma tarefa complexa, exigindo a configuração precisa de chips com bilhões de transistores em mapas de circuitos 3D que se assemelham a layouts urbanos—só que mais finos que um fio de cabelo humano. Esse processo demanda extensa colaboração entre diferentes equipes de engenharia, cada uma focada em aspectos distintos do design e usando ferramentas de software e linguagens de programação variadas.
Os designers de chips da Nvidia desenvolveram um método para os LLMs auxiliarem na criação de chips semicondutores. O autor principal, Mark Ren, diretor de pesquisa da Nvidia, afirmou: “Acredito que, ao longo do tempo, os modelos de linguagem de grande escala aprimorarão os processos de forma abrangente.”
O artigo foi apresentado pelo cientista-chefe da Nvidia, Bill Dally, durante um discurso principal na Conferência Internacional sobre Design Assistido por Computador em São Francisco. Dally comentou: “Esse esforço representa um primeiro passo significativo na aplicação de LLMs no complexo trabalho de design de semicondutores, demonstrando como campos especializados podem aproveitar seus dados internos para um treinamento eficaz de modelos de IA generativa.”
A equipe da Nvidia criou um LLM personalizado, chamado ChipNeMo, treinado com dados internos da empresa para gerar e otimizar software enquanto auxilia os designers. O objetivo a longo prazo é implementar IA generativa em todas as etapas do design de chips, melhorando significativamente a produtividade. As aplicações iniciais incluem um chatbot, um gerador de código e uma ferramenta de análise.
A ferramenta de análise recebeu feedback positivo, automatizando a tarefa tediosa de manter descrições de bugs atualizadas. Além disso, um protótipo de chatbot auxilia engenheiros a localizar rapidamente documentos técnicos, enquanto um gerador de código cria trechos de software especializados para designs de chips.
A pesquisa destaca a dedicação da equipe em reunir dados de design e criar um modelo de IA generativa sob medida aplicável a diversas indústrias. Ao começar com um modelo fundamental e utilizar o Nvidia NeMo—uma estrutura projetada para construir, personalizar e implementar modelos de IA generativa—eles refinam o modelo final ChipNeMo, que possui 43 bilhões de parâmetros e foi treinado com mais de um trilhão de tokens. Esse modelo demonstrou notável capacidade de reconhecer padrões.
O estudo exemplifica como uma equipe tecnicamente experiente pode aprimorar um modelo pré-treinado com seus próprios dados, ressaltando a necessidade de customizar LLMs, já que modelos menores podem superar versões maiores e de uso geral. A coleta e a limpeza de dados eficazes são vitais durante o processo de treinamento, e os usuários são incentivados a se manter informados sobre as últimas ferramentas que podem otimizar seus fluxos de trabalho.
À medida que a indústria de semicondutores começa a explorar as capacidades da IA generativa, esta pesquisa fornece insights cruciais. Empresas interessadas em desenvolver seus próprios LLMs personalizados podem aproveitar a estrutura NeMo, disponível no GitHub e no catálogo Nvidia NGC.
O artigo de pesquisa conta com contribuições de um grupo diversificado de especialistas, incluindo Mingjie Liu, Teo Ene, Robert Kirby, Chris Cheng, Nathaniel Pinckney, entre outros.