IBM nutzt die Leistungsfähigkeit des menschlichen Gehirns, um das Design seiner KI-Hardware zu innovieren und hat kürzlich den NorthPole-Chip vorgestellt. Dieser fortschrittliche Chip bietet eine überlegene Latenz und Energieeffizienz im Vergleich zu herkömmlichen GPUs und zeigt bedeutende Fortschritte im Bereich der künstlichen Intelligenz.
Der NorthPole-Chip basiert auf einer 12-Nanometer-Architektur, die speziell für neurale Inferenzaufgaben, wie Bildklassifizierung und Objekterkennung, optimiert ist. Laut einer aktuellen Forschungsstudie, veröffentlicht in Science, erreicht NorthPole eine beeindruckend 25-mal höhere Energieeffizienz und eine 22-mal niedrigere Latenz als vergleichbare GPUs im ResNet50-Benchmark. Mit 22 Milliarden Transistoren und ausreichend On-Chip-Speicher kann NorthPole Berechnungen direkt auf dem Chip durchführen, was den Zugriff auf externen Speicher erheblich reduziert und die Gesamteffizienz steigert.
Eine Schlüsselinnovation des NorthPole-Chips ist seine integrierte Natur – ähnlich wie das menschliche Gehirn. Wie IBM kommuniziert, „befindet sich der Speicher des Geräts vollständig auf dem Chip selbst, anstatt separat verbunden zu sein.“ Dieses Design vermeidet ständige Datenübertragungen zwischen Speicher und Verarbeitungseinheiten und umgeht effektiv den Neumann-Flaschenhals, der oft die Leistung beeinträchtigt.
„Der NorthPole-Chip ist im Grunde ein ganzes Netzwerk auf einem einzigen Chip“, erklärte Dharmendra Modha, IBMs Chefwissenschaftler für gehirninspirierte Rechner und führender Entwickler dieser Technologie. Bemerkenswerterweise kann NorthPole sogar Chips übertreffen, die mit modernsten Prozessen, wie 4-Nanometer-GPUs, hergestellt werden.
Technologischen Grenzen überschreiten
Während IBM plant, am NorthPole weiterzuarbeiten und mit 2-Nanometer-Knoten zu experimentieren – ein Fortschritt gegenüber den derzeit führenden 3-Nanometer-CPUs – hat dieser neue Chip Einschränkungen. Insbesondere fehlt der Zugriff auf externen Speicher, was bedeutet, dass umfangreiche neuronale Netzwerke nicht direkt verarbeitet werden können. Um diese Herausforderung zu meistern, wird eine „Scale-Out“-Technik verwendet, bei der größere Netzwerke in kleinere Komponenten aufgeteilt und diese „Teilnetzwerke“ über mehrere NorthPole-Chips verbunden werden. Modha bezeichnet diese Technik als „Scale-Out“ zur effizienten Verarbeitung.
„Wir können GPT-4 nicht auf diesem Chip laufen lassen, aber er ist in der Lage, viele enterprise-taugliche Modelle zu bedienen“, erklärte Modha. NorthPole ist speziell für Inferenzaufgaben konzipiert und somit ein vielversprechender Kandidat für Edge-Anwendungen, die eine Echtzeitverarbeitung erheblicher Datenmengen erfordern – besonders relevant in Bereichen wie der Technologie autonomer Fahrzeuge.
Gehirninspiriertes Design
Die Architektur von NorthPole ist von der Struktur und Funktion des menschlichen Gehirns inspiriert. Seine Netzwerke-on-Chip (NoCs) ermöglichen eine effiziente Kommunikation zwischen den Verarbeitungskernen, was die Verteilung von Berechnungen und Speicher weiter verbessert. IBM-Forscher vergleichen diese Wege mit den Verbindungen in der weißen und grauen Substanz des Gehirns, die einen effizienten Datenfluss innerhalb neuronaler Schaltungen ermöglichen.
Darüber hinaus zielt NorthPole darauf ab, die Präzision von Gehirnsynapsen nachzuahmen, indem eine geringere Bit-Präzision von zwei bis vier Bits verwendet wird, im Kontrast zu den acht bis sechzehn Bits traditioneller GPUs. Diese strategische Wahl reduziert sowohl den Speicher- als auch den Energiebedarf erheblich und trägt zur Effizienz des Chips bei.
Zukunftsperspektiven
IBM befindet sich noch in den frühen Phasen, das volle Potenzial des NorthPole-Chips zu erforschen, wobei laufende Forschungen zu verschiedenen Anwendungen durchgeführt werden. Der Chip wurde zunächst überwiegend auf Computer Vision-Aufgaben getestet, unterstützt durch Mittel des US-Verteidigungsministeriums. Anwendungen wie Objekterkennung, Bildsegmentierung und Video-Klassifizierung standen dabei im Fokus.
Darüber hinaus wurde NorthPole auch in anderen Bereichen wie natürlicher Sprachverarbeitung und Sprachrecognition getestet. Das Entwicklungsteam untersucht derzeit Möglichkeiten, Decoder-only große Sprachmodelle auf den Scale-Out-Systemen von NorthPole abzubilden, was neue Chancen für die Nutzung dieser fortschrittlichen Technologie in verschiedenen Sektoren eröffnet.