A IBM está aproveitando o poder do cérebro humano para inovar no design de seu hardware de inteligência artificial, e recentemente lançou o chip NorthPole. Este chip avançado apresenta latência e eficiência energética superiores em comparação com GPUs convencionais, demonstrando avanços significativos no campo da inteligência artificial.
O chip NorthPole opera com uma arquitetura de 12 nanômetros, otimizada especificamente para tarefas de inferência neural, como classificação de imagens e detecção de objetos. De acordo com pesquisas recentes publicadas na revista Science, o NorthPole alcança uma eficiência energética impressionante, 25 vezes maior, e uma latência 22 vezes inferior em relação a uma GPU comparável no benchmark ResNet50. Composto por 22 bilhões de transistores e ampla memória interna, o NorthPole pode realizar cálculos diretamente no chip, reduzindo significativamente a necessidade de acessar memória externa e aumentando a velocidade e eficiência gerais.
Uma das inovações principais do chip NorthPole é sua natureza autocontida—semelhante ao cérebro humano. Como comunicado pela IBM, “a memória do dispositivo está totalmente no chip, em vez de conectada separadamente.” Este design elimina a necessidade de transferências constantes de dados entre memória e unidades de processamento, evitando o gargalo de von Neumann que frequentemente prejudica o desempenho.
“O chip NorthPole é essencialmente uma rede inteira em um único chip,” explicou Dharmendra Modha, cientista-chefe da IBM em computação inspirada no cérebro e desenvolvedor líder dessa tecnologia. De forma notável, o NorthPole é capaz de superar até mesmo chips fabricados com processos de ponta, como GPUs de 4 nanômetros.
Desafiando os Limites da Tecnologia
Embora a IBM planeje iterar sobre o NorthPole, incluindo testes com nós de 2 nanômetros—um avanço em relação aos CPUs de 3 nanômetros de última geração—esse novo chip possui limitações. Notavelmente, ele não tem acesso à memória externa, o que significa que não pode rodar redes neurais maiores diretamente. Em vez disso, enfrenta esse desafio dividindo redes maiores em componentes menores, conectando esses “sub-rede” em diversos chips NorthPole. Modha se refere a essa técnica como "scale-out", permitindo um processamento eficiente.
“Não podemos executar o GPT-4 neste chip, mas ele é mais do que capaz de atender a muitos modelos de nível empresarial,” afirmou Modha. O NorthPole é designado especificamente para tarefas de inferência, tornando-se um candidato promissor para aplicações em edge que exigem processamento em tempo real de volumes substanciais de dados—particularmente relevante em áreas como tecnologia de veículos autônomos.
Design Inspirado no Cérebro
A arquitetura do NorthPole é inspirada na estrutura e função do cérebro humano. Suas redes em chip (NoCs) facilitam a comunicação entre núcleos de processamento, melhorando ainda mais a distribuição de computação e memória. Pesquisadores da IBM compararam esses caminhos às conexões de substância branca e cinza do cérebro, que permitem um fluxo de dados eficiente dentro de circuitos neurais.
Além disso, o NorthPole visa emular a precisão das sinapses cerebrais ao utilizar uma precisão de bits mais baixa, de dois a quatro bits, em contraste com os oito a dezesseis bits utilizados por GPUs tradicionais. Essa escolha estratégica diminui substancialmente tanto os requisitos de memória quanto de energia, contribuindo para a eficiência do chip.
Perspectivas Futuras
A IBM ainda está nas fases iniciais de exploração do potencial pleno do chip NorthPole, com pesquisas em diversas aplicações em andamento. Inicialmente, o chip foi predominantemente testado para tarefas de visão computacional, alinhadas ao financiamento recebido do Departamento de Defesa dos EUA. Aplicações como detecção, segmentação de imagens e classificação de vídeos foram o foco desses esforços.
Adicionalmente, o NorthPole foi testado em outras áreas, como processamento de linguagem natural e reconhecimento de fala. A equipe de desenvolvimento está atualmente investigando oportunidades para mapear modelos de linguagem grande somente de decodificadores nos sistemas de scale-out do NorthPole, abrindo novas portas para aproveitar essa tecnologia de ponta em diversos setores.