一支由数据中心技术领袖组成的联盟已经成立了超加速链(UALink)推广小组,旨在探索在数据中心内扩展AI系统的新方法。
关键行业参与者联合起来
包括超微(AMD)、博通(Broadcom)、思科(Cisco)、谷歌(Google)、惠普企业(HPE)、英特尔(Intel)、Meta和微软在内的领先企业,携手开发一种行业标准,以提升数据中心内AI系统的高速、低延迟通信能力。
引入UALink
UALink计划旨在创建一个开放的行业标准,使AI加速器之间能够更有效地沟通,从而促进AI连接数据中心的更好整合、灵活性和可扩展性。通过建立基于开放标准的互连,UALink将惠及系统原始设备制造商(OEM)、IT专业人士和系统集成商。
AMD数据中心解决方案组总经理Forrest Norrod强调了这一合作的重要性:“UALink为构建开放、高性能的加速器架构而努力,对于AI的未来至关重要。我们的专业知识结合将促进开放标准的发展,增强AI生态系统。”
值得注意的缺席
尽管推广小组在大规模AI和高性能计算方面拥有丰富经验,但知名AI芯片领导者Nvidia并未加入。
对开放标准的承诺
博通数据中心解决方案组副总裁Jas Tremblay表示:“作为UALink联盟的创始成员,我们希望推动数据中心大规模AI技术的应用。支持一个开放的生态系统对促进配备各种高速、低延迟解决方案的可扩展网络至关重要。”
有效扩展AI工作负载
随着AI计算需求的激增,建立一个稳健的低延迟网络,以便轻松集成额外的计算资源变得尤为重要。UALink小组旨在标准化规格,以创建一个高性能的AI工作负载环境,最大化性能输出。
该小组计划开发一个规格,旨在优化未来AI数据中心内AI和机器学习、高性能计算(HPC)及云应用的接口。他们的目标是为AI计算模块中的加速器和交换机之间的高速度、低延迟互连定义标准。
即将发布的1.0规格旨在支持单个AI计算模块中最多连接1,024个加速器,从而在加速器内存(如GPU)之间实现直接的数据加载和存储。
展望未来
UALink推广小组即将成立UALink联盟,预计将在2024年第三季度正式成立,届时将发布1.0规格供联盟成员使用。
关于UALink
超加速链(UALink)是一种前沿的加速器互连技术,旨在提升下一代AI和机器学习(ML)集群的性能。AMD、博通、思科、谷歌、HPE、英特尔、Meta和微软致力于成立一个开放标准组织,以制定支持突破性能的技术规格,同时促进数据中心加速器的开放生态系统。
思科通用硬件组执行副总裁Martin Lund指出:“随着AI工作负载的增长,超高性能互连将变得至关重要。我们的共同目标是创建UALink,这一可扩展的开放解决方案将应对构建AI超级计算机的挑战。”