從 Google 到 IBM:大型科技巨頭如何利用 Nvidia 的最新硬體和軟體解決方案

Nvidia 在舊金山的 GTC 大會上取得了重要進展。CEO 黃仁勳身著黑色皮夾克,在主題演講中吸引了如音樂會般的觀眾。他揭示了備受期待的 GB200 Grace Blackwell 超級芯片,承諾可為大型語言模型(LLM)推理工作負載提供高達 30 倍的性能提升。黃仁勳還強調了在汽車、機器人、Omniverse 和醫療保健方面的進展,引發了網絡上的熱烈討論。

在 GTC 大會上,展示行業合作夥伴關係是必不可少的。Nvidia 宣布正在加強與主要科技公司的合作,整合其新的 AI 計算基礎設施、軟體和服務。以下是宣布的主要合作夥伴關係摘要:

AWS

Nvidia 宣布 AWS 將在 EC2 實例中提供其新的 Blackwell 平台,這包括搭載 72 顆 Blackwell GPU 和 36 顆 Grace CPU 的 GB200 NVL72。此整合將使客戶能夠以更大規模和更低成本在多萬億參數的 LLM 上進行即時推理。此外,這兩家公司將為專為 AWS 開發的 AI 超級計算機 Project Ceiba 提供 20,736 顆 GB200 超級芯片,並將 Amazon SageMaker 與 Nvidia NIM 推理微服務整合。

Google Cloud

緊隨其後,Google Cloud 將把 Nvidia 的 Grace Blackwell 平台和 NIM 微服務整合進其雲基礎設施。該公司還宣布支持 JAX,這是一個用於高性能 LLM 訓練的 Python 原生框架,方便在 Nvidia H100 GPU 上部署 Nvidia NeMo 框架,並通過 Google Kubernetes Engine (GKE) 和 Google Cloud HPC 工具包進行管理。此外,Vertex AI 將支持由 NVIDIA H100 GPU 和 G2 VMs 由 NVIDIA L4 Tensor Core GPU 提供支持的 Google Cloud A3 VMs。

Microsoft

Microsoft 確認計劃在 Azure 中新增 NIM 微服務和 Grace Blackwell,並推出新的 Quantum-X800 InfiniBand 網絡平台。此外,該公司還將 DGX Cloud 與 Microsoft Fabric 整合,以簡化自定義 AI 模型的開發,並將新推出的 Omniverse Cloud API 提供於 Azure Power 平台上。在醫療保健方面,Azure 將利用 Nvidia 的 Clara 一系列微服務和 DGX Cloud 來支持臨床研究和護理服務的快速創新。

Oracle

Oracle 計劃在 OCI 超級集群和 OCI 計算實例上利用 Grace Blackwell 計算平台,並採用 Nvidia 的 GB200 超級芯片和 B200 Tensor Core GPU。他們宣布將 Nvidia NIM 和 CUDA-X 微服務,包括針對 RAG 推理部署的 NeMo Retriever,運用於 OCI 客戶的生成式 AI 應用,提升洞察力和準確性。

SAP

SAP 與 Nvidia 合作,將生成式 AI 嵌入其雲解決方案中,包括 SAP Datasphere、SAP Business Technology Platform 和 RISE with SAP。該公司還正在利用 Nvidia 的生成式 AI 工廠服務,在 SAP BTP 中開發額外的生成式 AI 功能,其中包括 DGX Cloud AI 超級計算和 Nvidia AI Enterprise 軟體。

IBM

IBM Consulting 計劃將其技術和行業專業知識與 Nvidia 的 AI Enterprise 軟體堆疊結合,包括新的 NIM 微服務和 Omniverse 技術。本次合作旨在加速客戶的 AI 工作流程,提升用例優化,並促進針對行業特定的 AI 解決方案的開發,包括供應鏈和製造業的數字孿生應用。

Snowflake

Snowflake 擴大了與 Nvidia 的合作,將 NeMo Retriever 整合進來,這是一種連接自訂 LLM 與企業數據的生成式 AI 微服務。此改進將提升使用 Snowflake Cortex 開發的聊天機器人應用的性能與可擴展性。此外,該合作還包括用於深度學習推理應用的低延遲 Nvidia TensorRT 軟體。

除了 Snowflake 外,還有一些數據平台供應商,包括 Box、Dataloop、Cloudera、Cohesity、Datastax 和 NetApp,承諾使用 Nvidia 微服務,特別是新的 NIM 技術,以優化 RAG 管道並將專有數據整合進生成式 AI 應用中。

Nvidia GTC 2024 定於 3 月 18 日至 3 月 21 日在舊金山和線上舉行。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles