IBM은 인간의 뇌의 힘을 활용하여 AI 하드웨어 설계를 혁신하고 있으며, 최근 NorthPole 칩을 출시했습니다. 이 첨단 칩은 기존 GPU에 비해 뛰어난 지연 시간과 에너지 효율성을 보여주며 인공지능 분야에서의 중요한 발전을 나타냅니다.
NorthPole 칩은 이미지 분류 및 객체 탐지와 같은 신경 추론 작업에 최적화된 12나노미터 아키텍처로 작동합니다. 최근 Science에 발표된 연구에 따르면, NorthPole은 ResNet50 벤치마크에서 비교 가능한 GPU보다 에너지 효율이 25배 더 뛰어나고 지연 시간이 22배 더 낮습니다. 220억 개의 트랜지스터와 충분한 온칩 메모리를 갖춘 NorthPole은 계산을 칩 내부에서 직접 수행할 수 있어 외부 메모리 접근을 크게 줄이고 전반적인 속도 및 효율성을 향상시킵니다.
NorthPole 칩의 주요 혁신 중 하나는 인간의 뇌와 유사한 자가 포함 구조입니다. IBM의 설명에 따르면 “장치의 메모리는 칩 자체에 완전히 통합되어 별도로 연동되지 않는다”고 합니다. 이 설계는 메모리와 처리 장치 간의 지속적인 데이터 전송을 제거하여 성능을 저해하는 폰 노이만 병목 현상을 효과적으로 회피합니다.
“NorthPole 칩은 사실상 단일 칩에 전체 네트워크가 집약되어 있다”고 IBM의 뇌 영감을 받은 컴퓨팅 수석 과학자이자 기술의 선도 개발자인 다르멘드라 모다(Dharmendra Modha)가 설명했습니다. 놀랍게도 NorthPole은 4나노미터 GPU와 같은 최신 공정을 사용하여 제작된 칩보다도 뛰어난 성능을 발휘할 수 있습니다.
기술의 경계를 넘어
IBM은 NorthPole을 반복적으로 개선하고 있으며, 현재 최첨단 3나노미터 CPU를 넘어 2나노미터 노드를 실험할 계획입니다. 그러나 이 새로운 칩에는 제한이 있습니다. 특히 외부 메모리에 접근할 수 없어 더 대규모 신경망을 직접 실행할 수 없습니다. 대신, larger networks는 작은 구성 요소로 나누어 여러 NorthPole 칩 간에 '서브 네트워크'를 연결하여 처리합니다. 모다는 이 기법을 “스케일 아웃(scale-out)”이라고 부르며 효율적인 처리를 가능하게 합니다.
“이 칩에서 GPT-4를 실행할 수는 없지만, 여러 기업 수준 모델을 처리하는 데는 충분히 능력이 있습니다.”라고 모다가 말했습니다. NorthPole은 주로 추론 작업에 지정되어 있으며, 즉각적인 대량 데이터 처리가 필요한 엣지 어플리케이션에 적합한 유망한 후보입니다—특히 자율주행 차량 기술 분야에서 더욱 관련성이 높습니다.
뇌에서 영감을 받은 설계
NorthPole의 아키텍처는 인간 뇌의 구조와 기능에서 영감을 받았습니다. 네트워크 온 칩(NoCs)은 처리 코어 간의 통신을 촉진하여 계산 및 메모리 분배를 더욱 향상시킵니다. IBM 연구자들은 이러한 경로를 뇌의 백질과 회색질 연결에 비유하여 신경 회로 내에서 효율적인 데이터 흐름을 가능하게 합니다.
또한, NorthPole은 전통적인 GPU가 사용하는 8-16비트 대신 2-4비트의 낮은 비트 정밀도를 활용하여 뇌의 시냅스 정밀도를 모방하려고 합니다. 이 전략적 선택은 메모리 및 전력 요구 사항을 크게 줄여 칩의 효율성에 기여합니다.
미래 전망
IBM은 NorthPole 칩의 잠재력을 탐색하는 초기 단계에 있으며 다양한 응용 프로그램을 연구 중입니다. 초기에는 미국 국방부의 자금 지원에 따라 컴퓨터 비전 작업에 주로 테스트되었습니다. 감지, 이미지 분할 및 비디오 분류를 포함한 응용 프로그램들이 이러한 노력의 초점이었습니다.
추가로, NorthPole은 자연어 처리 및 음성 인식과 같은 다른 분야에서도 시험되었습니다. 개발 팀은 NorthPole의 스케일 아웃 시스템에 디코더 전용 대형 언어 모델을 매핑할 기회를 조사하고 있으며, 이를 통해 다양한 분야에서 이 첨단 기술을 활용할 새로운 길을 열고 있습니다.