NVIDIA 推出企業級生成式 AI 微服務，加速 AI 應用部署與創新。

Home AI新聞 NVIDIA 推出企業級生成式 AI 微服務，加速 AI 應用部署與創新。

在人工智慧領域，各公司面臨前所未有的機會與挑戰。為滿足對快速、高效及客製化AI應用日益增長的需求，NVIDIA於2024年3月18日在加州聖荷西總部發布了多項企業級生成AI微服務。這些微服務旨在為開發者提供強大的平台，以創建和部署量身訂製的生成AI助手，同時保護企業的知識產權和完全控制權。

新推出的生成AI微服務建立在NVIDIA CUDA平台之上，包含NVIDIA NIM微服務，這些微服務提升了NVIDIA生態系統中超過20個受歡迎的AI模型的推理性能。用戶還可以利用NVIDIA的CUDA-X微服務，使用加速的軟體開發工具包、庫及工具，進行強化檢索增強生成(RAG)、資料保護及高效能運算(HPC)等任務。此外，NVIDIA還針對醫療領域推出了超過20個專門的NIM和CUDA-X微服務，進一步拓展AI在醫療保健中的應用潛力。

這些微服務為NVIDIA的全堆疊計算平台增添了新的維度，緊密聯繫模型開發者、平台供應商與企業，形成強大的AI生態系統。企業可以輕鬆部署針對NVIDIA CUDA基礎的優化客製化AI模型，該基礎包括雲端、數據中心、工作站及PC中的數十億顆GPU。

NVIDIA創始人兼CEO黃仁勳強調，企業平台擁有龐大的數據資源，可以轉化為生成AI助手，顯著提升商業價值。與合作夥伴共同開發的容器化AI微服務將成為行業轉型至AI的基石。

NIM推理微服務顯著縮短了部署時間，將以往需要數周的時間縮短至幾分鐘。這些微服務提供基於NVIDIA推理軟體的預建容器，包括Triton推理伺服器和TensorRT-LLM，使開發者能快速創建和部署AI應用。此外，NIM微服務還在語言處理、語音識別和藥物發現等領域提供行業標準API，幫助開發者利用專有數據進行更安全高效的AI應用開發。

在實際應用中，ServiceNow等公司已經開始使用NIM，以加速特定領域助手和生成AI應用的開發。用戶可以通過Amazon SageMaker、Google Kubernetes Engine及Microsoft Azure AI等平台訪問NIM微服務，並將其與Deepset和LangChain等流行AI框架整合。

除了NIM微服務，CUDA-X微服務也為AI應用開發提供了強大的支持。這些微服務提供了從數據準備、客製化到訓練的端到端構建模塊，幫助企業加速生產級AI的開發。借助NVIDIA Riva進行自訂語音和翻譯AI開發，以及NVIDIA cuOpt進行路由優化，企業能提升AI應用的性能和準確性。此外，NeMo Retriever微服務的推出使開發者能夠更密切地將AI應用與業務數據聯繫起來，改善AI助手的精確度和洞察力。

總之，NVIDIA推出的企業級生成AI微服務為企業提供了強大的技術支持和創新動力。這些微服務不僅簡化了AI應用的開發和部署過程，同時為企業提供了更高的靈活性和性能。隨著AI技術的持續演進，這些微服務注定將在推動AI應用的普及與創新中發揮重要作用。

即將推出的 OpenAI GPT-5 模型：提升 AI 助手自主執行任務的能力

探索 OpenAI Sora 最新影片：釋放無盡的全球創意