英特尔推出全新Xeon 6处理器和Gaudi 3 AI加速器,以提升AI性能
英特尔正式推出Xeon 6处理器和Gaudi 3 AI加速器,旨在进一步巩固在AI领域的地位。Xeon 6处理器的设计目的是将AI视觉性能提升一倍,同时Gaudi 3加速器的吞吐量提高了20%。
满足AI基础设施需求
随着AI技术在各行业的广泛应用,企业对迅速开发和部署的高性价比基础设施的需求日益增加。为此,英特尔的新Xeon 6和Gaudi 3解决方案旨在每瓦特实现最佳性能,以满足强大AI系统的需求,并降低总体拥有成本(TCO)。
英特尔数据中心与AI集团执行副总裁Justin Hotard表示:“对AI的需求正在改变数据中心,行业亟需多样化的硬件、软件及开发工具。通过推出Xeon 6和Gaudi 3,英特尔正在创造一个更开放的生态系统,提升工作负载的性能、效率和安全性。”
介绍英特尔Xeon 6处理器和Gaudi 3 AI加速器
英特尔的最新创新包括Xeon 6处理器在数据中心组合上的显著更新。这些处理器专为计算密集型工作负载设计,性能是前代的两倍,具备更高的内核数、双倍的内存带宽,以及嵌入式AI加速功能,确保从边缘到云端的最佳效率。
Gaudi 3 AI加速器则针对大型生成式AI进行了优化,配备64个张量处理核心(TPC)和8个矩阵乘法引擎(MME),支持128GB的HBMe2内存进行训练和推理,并提供24个200千兆以太网端口以实现可扩展网络。此外,Gaudi 3与PyTorch框架和先进的Hugging Face变压器模型完全兼容。英特尔与IBM合作,在IBM Cloud上以服务形式部署Gaudi 3 AI加速器,旨在降低TCO并提升AI性能。
提升AI系统的TCO优势
英特尔的Xeon 6和Gaudi 3增强功能专为可扩展的AI部署而设计,提供灵活的选择、具竞争力的定价及可及的AI技术。目前,73%的GPU加速服务器依赖英特尔Xeon作为主机CPU,英特尔的x86基础设施和开放生态系统能够支持企业构建高价值的AI系统。
英特尔与包括戴尔科技、惠普企业和超微在内的领先OEM合作,共同设计满足客户特定需求的高效AI部署系统。戴尔科技目前正在开发基于Xeon 6和Gaudi 3的检索增强生成(RAG)解决方案。
将生成式AI解决方案从原型转变为可投入生产的系统时,需要解决实时监控、错误处理、日志记录、安全性和可扩展性等挑战。英特尔正与OEM紧密合作,提供基于开放平台企业AI(OPEA)框架的可生产RAG解决方案,整合微服务以优化Xeon和Gaudi系统的流程。
扩大企业AI应用的访问
英特尔继续增强对企业AI解决方案的访问。英特尔Tiber产品系列针对AI、云和边缘环境中的访问、成本、复杂性、安全性、效率和可扩展性问题进行了针对性解决。现在,英特尔® Tiber™开发者云提供Xeon 6的预览系统,供技术评估和测试。
部分客户亦将提前获取Gaudi 3,以验证AI模型的部署,Gaudi 3集群预计将在下季度推出,支持大规模生产。
此外,新的服务产品包括SeekrFlow,这是Seekr推出的一款端到端AI平台,用于开发可信的AI应用。最新更新包括对Intel Gaudi软件和Jupyter Notebook的支持,现在可兼容PyTorch 2.4和英特尔oneAPI,进一步提升了Xeon 6处理器的AI加速能力。