埃隆·马斯克在田纳西州推出全球最强大的AI训练集群
7月23日,埃隆·马斯克在社交媒体上宣布,他的AI初创公司xAI在田纳西州孟菲斯市推出了全球最强大的AI训练集群。这个令人瞩目的集群由100,000个液冷的NVIDIA H100 GPU组成,早在去年就开始投入使用。
马斯克强调,该集群采用单一的RDMA(远程直接内存访问)架构,显著提升了计算节点之间的数据传输效率,降低了延迟,并减轻了中央处理器(CPU)的负担。今年5月,马斯克提到将H100芯片整合进一台超级计算机,称之为计算能力的“超级工厂”,与特斯拉的“超级工厂”概念相呼应。
xAI的目标是在2024年12月前训练出一款马斯克所称的“全球最强大AI”。孟菲斯的超级集群将在这一目标中扮演关键角色。然而,一些专家对此时间表持谨慎态度,指出马斯克在实现雄心勃勃的项目期限时面临挑战,以往包括完全自动化车辆和载人火星计划的实例均引发关注。
此外,马斯克还宣布,特斯拉计划在明年开始小规模生产Optimus机器人,预计到2026年实现大规模投放。这一时间表与早前亿万资金支援下的计划有所调整,之前他曾提及Optimus机器人将在2024年底前供内部使用,并于2025年开始向其他公司交付。
与此同时,微软与OpenAI首席执行官山姆·奧特曼正在共同开发一台名为“星际门”(Stargate)的超级计算机,专用于AI训练,项目估值高达1000亿美元。如果成功,xAI的孟菲斯超级集群可能很快将失去全球最强大的AI集群的称号。