IBM использует мощь человеческого мозга для инновационного проектирования своего аппаратного обеспечения ИИ, недавно представив чип NorthPole. Этот продвинутый чип демонстрирует превосходную задержку и энергоэффективность по сравнению с традиционными графическими процессорами (GPU), подчеркивая значительные достижения в области искусственного интеллекта.
Чип NorthPole работает на архитектуре с размером техпроцесса 12 нанометров, оптимизированной для нейронных задач, таких как классификация изображений и обнаружение объектов. Согласно недавним исследованиям, опубликованным в журнале Science, NorthPole достигает впечатляющей энергоэффективности в 25 раз превосходящей аналоги и обладает в 22 раза меньшей задержкой по сравнению с сопоставимым GPU по тесту ResNet50. Состоящий из 22 миллиардов транзисторов и располагая значительным объемом встроенной памяти, NorthPole может выполнять вычисления непосредственно на чипе, что значительно снижает необходимость доступа к внешней памяти и повышает общую скорость и эффективность.
Ключевым новшеством чипа NorthPole является его автономная природа — аналогичная человеческому мозгу. Как указывает IBM, «память устройства полностью размещена на самом чипе, а не подключена отдельно». Эта конструкция устраняет необходимость в постоянной передаче данных между памятью и процессорными единицами, эффективно обходя узкое место в архитектуре фон Неймана, которое часто тормозит производительность.
«Чип NorthPole по сути представляет собой всю сеть на одном чипе», — объясняет Дхармендра Модха, главный ученый IBM по вычислениям, вдохновленным работой мозга, и ведущий разработчик этой технологии. Примечательно, что NorthPole способен обойдаться без чипов, изготовленных с использованием более современных технологий, таких как 4-нм GPU.
Преодоление технических границ
Хотя IBM планирует дальнейшие разработки NorthPole, включая эксперименты с 2-нм узлами (продвинутыми по сравнению с современными 3-нм процессорами), новый чип имеет свои ограничения. Он не имеет доступа к внешней памяти, что не позволяет напрямую обрабатывать более крупные нейронные сети. Вместо этого он справляется с этой задачей, разбивая более обширные сети на меньшие компоненты и соединяя эти «подсети» между несколькими чипами NorthPole. Модха называет эту технику «масштабированием», что обеспечивает эффективную обработку.
«Мы не можем запустить GPT-4 на этом чипе, но он вполне способен обслуживать многие модели для корпоративного уровня», — добавил Модха. NorthPole специально разработан для задач инференса, что делает его перспективным кандидатом для прикладных решений в реальном времени, требующих обработки больших объемов данных — особенно актуально для технологий автономных автомобилей.
Дизайн, вдохновленный мозгом
Архитектура NorthPole черпает вдохновение из структуры и функций человеческого мозга. Его сети на чипе (NoC) обеспечивают связь между процессорными ядрами, что способствует улучшению вычислений и распределения памяти. Исследователи IBM сравнивают эти пути с белым и серым веществом мозга, которое обеспечивает эффективный поток данных в нейронных цепях.
Кроме того, NorthPole стремится имитировать точность синапсов мозга, используя более низкую битовую точность — от двух до четырех бит, в отличие от восьми- до шестнадцати бит, применяемых традиционными GPU. Этот стратегический выбор существенно снижает как требования к памяти, так и энергозатраты, что способствует эффективности чипа.
Будущие перспективы
IBM все еще находится на ранних этапах изучения полного потенциала чипа NorthPole, проводя исследования в различных приложениях. Изначально чип тестировался в основном для задач компьютерного зрения, что связано с финансированием, полученным от Министерства обороны США. Основное внимание уделяется таким приложениям, как обнаружение, сегментация изображений и классификация видео.
Кроме того, NorthPole также испытывается в других областях, таких как обработка естественного языка и распознавание речи. Команда разработчиков в настоящее время исследует возможности адаптации моделей с только декодером на системы масштабирования NorthPole, открывая новые горизонты для использования этой передовой технологии в различных секторах.