前沿(Frontier)是位于田纳西州奥克里奇国家实验室的一台开创性超级计算机,继续稳居全球最强的非分布式超级计算机。根据最新发布的《Top500》榜单,自2022年6月以来,前沿一直保持着这一荣誉。该先进的AMD/HPE系统每秒能够实现惊人的1.194 Exaflops的计算性能。换句话说,一个Exaflop相当于一个人每秒进行一次运算,持续31.7亿年。前沿计算机拥有超过860万个核心,专为高性能计算和人工智能任务精心设计。其强大的功能支持关键项目,包括核反应堆生命周期的全面映射和与疾病研究相关的重大遗传学突破。目前,前沿仍然是《Top500》榜单上唯一的典范级超级计算机,尽管这一局面可能很快会发生改变。
英特尔的新兴力量
英特尔的Aurora超级计算机正在迅速接近前沿,该计算机与阿贡国家实验室共同开发。近期,Aurora已经跃过富士通的Fugaku,成为排行榜的第二名。虽然Aurora仍处于调试阶段,但预计完工后可达到惊人的2 Exaflops每秒。该系统位于伊利诺伊州的阿贡领导计算设施,由10,000台服务器组成,集成了超过21,000个CPU和60,000个GPU。值得注意的是,这次排名中提交的结果仅展示了Aurora的一半能力,暗示它可能在未来的评估中超越前沿。
Aurora上正在进行的一个开创性项目涉及生成型人工智能,该超级计算机正在运行一个万亿参数版本的OpenAI领先语言模型GPT-3。这个庞大的模型将基于大量科学文献、编程资源和各类科学数据集进行训练,为癌症研究、气候科学和宇宙学等领域的研究人员提供宝贵的资源。凭借英特尔的Max系列GPU架构,Aurora展示了仅用64个节点处理庞大模型的能力。阿贡国家实验室成功证明了Aurora在10,000个节点的广泛网络下,能够加速处理使用万亿个标记的庞大模型的训练。
尽管其他英特尔设备未能达到Aurora的高度,但仍值得一提。洛斯阿拉莫斯国家实验室的Crossroads排名第24,而新部署的Dawn Phase 1,目前是英国最快的AI超级计算机,排名第41。此外,位于德国莱布尼茨超级计算中心的SuperMUC-NG Phase 2也安全地占据第52位。《Top500》榜单还显示,20个新系统使用英特尔的Sapphire Rapids CPU,使其成为新入榜的领先CPU。然而,在新增的45个系统中,只有四个配备了英特尔的GPU。
微软的崛起
微软也取得了显著进展。基于Azure的Eagle超级计算机跃升至第三位,使Fugaku降至第四。Eagle拥有112万计算核心,搭载了Nvidia最新的H100芯片和英特尔的Xeon Platinum 8480C处理器。Eagle于8月上线,专为访问巨型语言模型而设计,包括托管在微软Azure上的OpenAI的GPT-4。它还支持NDv5虚拟机,使Eagle成为《Top500》榜单中排名最高的云计算系统,并且是前十名中最快的H100系统。
《Top500》的其他见解
在前十名超级计算机中,英特尔、AMD和IBM处理器是高性能计算系统的首选。在这个精英群体中,五台使用英特尔Xeon,两个采用AMD硬件,另外两个则集成IBM处理器。美国以161台超级计算机继续领先,远超中国的104台。同时,北美的超级计算机数量已从160台增加到171台,而亚洲的总数则从192台减少到169台。然而,欧洲增长明显,从133台上升至143台。尽管日本的Fugaku已滑落至第四位,但依然保持非美国超级计算机中的最高排名,显示其在全球超级计算机领域的重要性。