IBM exploite la puissance du cerveau humain pour innover dans la conception de son matériel d'IA, avec l'introduction récente de la puce NorthPole. Cette puce avancée se distingue par une latence et une efficacité énergétique supérieures par rapport aux GPU conventionnels, illustrant des progrès significatifs dans le domaine de l'intelligence artificielle.
La puce NorthPole fonctionne sur une architecture de 12 nanomètres, optimisée pour les tâches d'inférence neuronale, telles que la classification d'images et la détection d'objets. Selon des recherches récentes publiées dans Science, la NorthPole atteint une efficacité énergétique impressionnante, 25 fois supérieure avec une latence 22 fois moindre qu'un GPU comparable sur le benchmark ResNet50. Composée de 22 milliards de transistors et d'une mémoire interne suffisante, la NorthPole peut exécuter des calculs directement sur la puce, réduisant considérablement le besoin d'accès à la mémoire externe et améliorant la vitesse et l'efficacité globales.
Une innovation clé de la puce NorthPole est sa nature autonome, semblable au cerveau humain. Comme l'indique IBM, « la mémoire de l'appareil est entièrement intégrée sur la puce, plutôt que connectée séparément ». Ce design élimine la nécessité de transferts constants de données entre la mémoire et les unités de traitement, contournant ainsi le goulot d'étranglement de von Neumann qui freine souvent les performances.
« La puce NorthPole est essentiellement un réseau complet sur une seule puce », a expliqué Dharmendra Modha, scientifique en chef d'IBM pour l'informatique inspirée du cerveau, et principal développeur de cette technologie. Fait remarquable, la NorthPole réussit à surpasser même les puces fabriquées avec des processus plus récents, tels que les GPU de 4 nanomètres.
Poussant les limites de la technologie
Bien qu'IBM envisage d'itérer sur la NorthPole, y compris des expériences avec des nœuds de 2 nanomètres—une avancée par rapport aux CPU de 3 nanomètres actuels—cette nouvelle puce présente certaines limitations. Elle n'a notamment pas accès à la mémoire externe, ce qui l'empêche d'exécuter des réseaux neuronaux plus vastes directement. Pour relever ce défi, elle divise les réseaux plus importants en composants plus petits, interconnectant ces « sous-réseaux » sur plusieurs puces NorthPole. Modha qualifie cette technique de « scale-out », permettant un traitement efficace.
« Nous ne pouvons pas faire fonctionner GPT-4 sur cette puce, mais elle est plus que capable de servir de nombreux modèles au niveau de l'entreprise », a déclaré Modha. La NorthPole est spécifiquement conçue pour des tâches d'inférence, la rendant prometteuse pour les applications en edge computing nécessitant un traitement en temps réel de volumes de données importants, notamment dans des domaines comme la technologie des véhicules autonomes.
Conception inspirée du cerveau
L'architecture de la NorthPole s'inspire de la structure et du fonctionnement du cerveau humain. Ses réseaux sur puce (NoC) facilitent la communication entre les cœurs de traitement, améliorant ainsi la répartition des calculs et de la mémoire. Les chercheurs d'IBM comparent ces chemins aux connexions entre la matière blanche et la matière grise du cerveau, qui permettent un flux de données efficace au sein des circuits neuronaux.
De plus, la NorthPole vise à imiter la précision des synapses cérébrales en utilisant une précision de bits inférieure, de deux à quatre bits, contrairement aux huit à seize bits employés par les GPU traditionnels. Ce choix stratégique réduit considérablement les besoins en mémoire et en puissance, contribuant à l'efficacité de la puce.
Perspectives d'avenir
IBM en est encore aux premières phases d'exploration du potentiel de la puce NorthPole, avec des recherches en cours sur diverses applications. Initialement, la puce a principalement été testée pour des tâches de vision par ordinateur, conformément au financement reçu du département de la Défense des États-Unis. Les applications telles que la détection, la segmentation d'images et la classification vidéo ont été au cœur de ces efforts.
Par ailleurs, la NorthPole a été éprouvée dans d'autres domaines, comme le traitement du langage naturel et la reconnaissance vocale. L'équipe de développement explore actuellement les opportunités de cartographier des modèles de langage de type décodeur sur les systèmes scale-out de la NorthPole, ouvrant de nouvelles perspectives pour tirer parti de cette technologie de pointe dans divers secteurs.