IBM正在利用人脑的强大能力来创新其人工智能硬件设计,最近推出了北极星芯片。与传统GPU相比,这款先进的芯片在延迟和能效方面表现卓越,展现了人工智能领域的重要进展。
北极星芯片基于12纳米架构,专门优化用于神经推理任务,如图像分类和目标检测。最近在《科学》杂志上发布的研究表明,北极星在ResNet50基准上实现了惊人的25倍能效提升和22倍更低延迟。该芯片由220亿个晶体管组成,并且具有丰富的片上存储器,能够直接在芯片上进行计算,显著减少了对外部存储器的访问需求,提高了整体速度和效率。
北极星芯片的一个关键创新在于其自包含特性——类似于人脑。IBM在其沟通中指出:“设备的存储完全在芯片上,而非单独连接。”这种设计消除了内存与处理单元之间频繁数据传输的需要,有效避免了常常限制性能的冯·诺依曼瓶颈。
IBM脑启发计算的首席科学家兼该技术主要开发者Dharmendra Modha解释道:“北极星芯片实际上是在单一芯片上的整个网络。”令人惊讶的是,北极星能够超越一些采用更先进工艺制造的芯片,例如4纳米GPU。
技术极限的突破
虽然IBM计划在北极星基础上进行迭代,包括尝试2纳米节点——这将超越目前最先进的3纳米处理器,但这款新芯片也存在局限性。尤其是它无法访问外部存储器,这意味着无法直接运行更庞大的神经网络。相反,它通过将较大的网络划分为较小的组件,在多个北极星芯片之间连接这些“子网络”来应对这一挑战。Modha称之为“扩展”,以实现高效处理。
Modha表示:“我们无法在这一芯片上运行GPT-4,但它能够支持许多企业级模型。”北极星专为推理任务设计,使其成为需要实时处理大量数据的边缘应用的理想选择,尤其在自动驾驶技术等领域具有重要价值。
脑启发设计
北极星的架构受到人脑结构和功能的启发。其片上网络(NoCs)促进了处理核心之间的通信,进一步增强了计算和内存分配。IBM研究人员将这些路径类比为人脑中的白质和灰质连接,使得神经电路中的数据流动更为高效。
此外,北极星旨在通过使用两到四位的较低位精度模拟脑突触的精确性,而传统GPU通常使用八到十六位。这一战略选择显著减少了内存和功耗,从而提升了芯片的效率。
未来展望
IBM仍处于探索北极星芯片全部潜力的初期阶段,正在进行多种应用的研究。最初,这款芯片主要用于计算机视觉任务,与美国国防部获得的资金相一致,重点包括目标检测、图像分割和视频分类。
此外,北极星还在自然语言处理和语音识别等其他领域进行了试验。开发团队目前正在探索将仅解码的大型语言模型映射到北极星的扩展系统上的机会,为在各个行业利用这一尖端技术开辟新局面。