NVIDIA推出企业级生成式AI微服务，加速AI应用部署与创新

Home AI News CN NVIDIA推出企业级生成式AI微服务，加速AI应用部署与创新

在人工智能领域，各公司面临前所未有的机遇与挑战。为了满足对快速、高效和定制化AI应用日益增长的需求，NVIDIA于2024年3月18日在加利福尼亚州圣何塞总部推出了多项企业级生成AI微服务。这些微服务旨在为开发者提供一个强大的平台，以创建和部署量身定制的生成AI助手，同时确保企业对知识产权的完全所有权和控制。

新推出的生成AI微服务基于NVIDIA的CUDA平台，包括NVIDIA NIM微服务，增强了NVIDIA生态系统中20多种流行AI模型的推理性能。用户还可以利用CUDA-X微服务，使用NVIDIA加速的软件开发工具包、库和工具，完成增强的检索增强生成（RAG）、数据保护和高性能计算（HPC）等任务。此外，NVIDIA推出了20多项专为医疗行业定制的NIM和CUDA-X微服务，进一步拓展了AI在医疗领域的应用潜力。

这些微服务为NVIDIA的全栈计算平台增添了新维度，将模型开发者、平台提供商和企业紧密联系在一起，构建强大的AI生态系统。企业可以轻松部署针对NVIDIA CUDA基础架构优化的定制AI模型，该基础架构支持云端、数据中心、工作站和个人电脑的数十亿个GPU。

NVIDIA创始人兼首席执行官黄仁勋强调，企业平台拥有大量数据资源，这些资源可以转化为生成AI助手，从而显著提升商业价值。与合作伙伴共同开发的容器化AI微服务将成为各行业向AI转型的基石。

NIM推理微服务的推出显著缩短了部署时间，将原本需要数周的过程缩短至几分钟。这些微服务基于NVIDIA的推理软件构建预制容器，包括Triton推理服务器和TensorRT-LLM，使开发者能够快速创建和部署AI应用。此外，NIM微服务在语言处理、语音识别和药物发现等领域提供了行业标准API，帮助开发者利用专有数据进行更安全和高效的AI应用开发。

在实际应用中，像ServiceNow这样的公司已经开始使用NIM来加速特定领域助手和生成AI应用的开发。用户可以通过Amazon SageMaker、Google Kubernetes Engine和Microsoft Azure AI等平台访问NIM微服务，并将其与Deepset和LangChain等流行AI框架集成。

除了NIM微服务，CUDA-X微服务还为AI应用开发提供了重要支持。这些微服务为数据准备、定制和训练提供了端到端的构建模块，帮助企业加快生产级AI的开发。通过NVIDIA Riva进行定制语音和翻译AI开发，以及通过NVIDIA cuOpt优化路由，企业能够提升其AI应用的性能和准确性。此外，NeMo Retriever微服务的推出使开发者能够将AI应用与业务数据紧密结合，提升AI助手的精确性和洞察力。

总之，NVIDIA推出的企业级生成AI微服务为企业提供了强大的技术支持和创新动力。这些微服务不仅简化了AI应用的开发和部署流程，还为企业提供了更高的灵活性和性能。随着AI技术的不断发展，这些微服务将在推动AI应用的普及与创新中发挥重要作用。

即将发布的OpenAI GPT-5模型：提升AI助手自主执行任务的能力

探索OpenAI Sora最新视频：释放全球无限创意