IBMは、人工知能(AI)ハードウェア設計において人間の脳の力を活用しており、新たにNorthPoleチップを発表しました。この先進的なチップは、従来のGPUと比べて優れたレイテンシとエネルギー効率を示し、人工知能分野での大きな進展を示しています。
NorthPoleチップは、画像分類や物体検出などの神経推論タスクに最適化された12ナノメートルアーキテクチャで動作します。最新の研究によると、NorthPoleはResNet50ベンチマークで、同等のGPUと比較してエネルギー効率が25倍高く、レイテンシが22倍低いという驚異的なパフォーマンスを発揮します。220億のトランジスタと豊富なオンチップメモリを搭載し、計算をチップ上で直接実行することが可能で、外部メモリへのアクセスが大幅に減少し、全体的な速度と効率が向上します。
NorthPoleチップの主な革新点は、その自己完結型の構造です。IBMによると、「デバイスのメモリはチップ自体に完全に内蔵されており、別々に接続されることはありません」。このデザインは、メモリと処理ユニット間のデータ転送を排除し、よくあるボトルネックであるフォン・ノイマンの問題を回避します。
「NorthPoleチップは、実質的には単一のチップ上の全ネットワークです」と、IBMの脳-inspiredコンピューティングの主任科学者であるダルメンドラ・モーダ氏は説明します。驚くべきことに、NorthPoleは4ナノメートルGPUなど、より先進的なプロセスで製造されたチップを上回る性能を発揮します。
技術の限界を押し広げる
IBMはNorthPoleのバージョンアップを視野に入れており、将来的には2ナノメートルノードでの実験も検討しています。しかし、この新しいチップにはいくつかの制約もあります。特に、外部メモリへのアクセスができないため、より大きな神経ネットワークを直接実行することはできません。その代わり、モーダ氏はこの課題に対して「スケールアウト」という手法を用いて、より大きなネットワークを小さなコンポーネントに分割し、複数のNorthPoleチップを介して接続します。
「このチップでGPT-4を実行することはできませんが、多くのエンタープライズレベルのモデルに対応する能力は十分にあります」とモーダ氏は述べています。NorthPoleは特に推論タスク向けに設計されており、大量のデータをリアルタイムで処理するエッジアプリケーションに非常に適しています。特に、自動運転技術などの分野での利用が期待されています。
脳からインスパイアを受けた設計
NorthPoleのアーキテクチャは、人間の脳の構造と機能にインスパイアを受けています。そのネットワークオンチップ(NoCs)は、処理コア間の通信を促進し、計算とメモリの分配をさらに向上させます。IBMの研究者たちは、これらの経路を脳の白質と灰白質の接続に例え、神経回路内でのデータフローの効率性を強調しています。
さらに、NorthPoleは脳のシナプスの精度を模倣することを目指しており、従来のGPUが使用する8から16ビットに対し、2から4ビットの低ビット精度を用いています。この戦略的選択は、メモリと電力の要件を大幅に削減し、チップの効率向上に貢献します。
未来の展望
IBMはNorthPoleチップの潜在能力を探る初期段階にあり、さまざまな用途に関する研究が進行中です。最初はアメリカ国防総省からの資金提供に応じて、コンピュータビジョンタスクに主に活用されてきました。具体的には、物体検出、画像セグメンテーション、ビデオ分類などが中心です。
さらに、NorthPoleは自然言語処理や音声認識などの他の分野でも試験が行われています。開発チームは、デコーダ専用の大規模言語モデルをNorthPoleのスケールアウトシステムにマッピングする機会を検討しており、この先進的な技術を様々な分野で活用する新しい扉を開くことが期待されています。