NVIDIA推出企业级生成式AI微服务,加速AI应用部署与创新

在人工智能领域,各公司面临前所未有的机遇与挑战。为了满足对快速、高效和定制化AI应用日益增长的需求,NVIDIA于2024年3月18日在加利福尼亚州圣何塞总部推出了多项企业级生成AI微服务。这些微服务旨在为开发者提供一个强大的平台,以创建和部署量身定制的生成AI助手,同时确保企业对知识产权的完全所有权和控制。

新推出的生成AI微服务基于NVIDIA的CUDA平台,包括NVIDIA NIM微服务,增强了NVIDIA生态系统中20多种流行AI模型的推理性能。用户还可以利用CUDA-X微服务,使用NVIDIA加速的软件开发工具包、库和工具,完成增强的检索增强生成(RAG)、数据保护和高性能计算(HPC)等任务。此外,NVIDIA推出了20多项专为医疗行业定制的NIM和CUDA-X微服务,进一步拓展了AI在医疗领域的应用潜力。

这些微服务为NVIDIA的全栈计算平台增添了新维度,将模型开发者、平台提供商和企业紧密联系在一起,构建强大的AI生态系统。企业可以轻松部署针对NVIDIA CUDA基础架构优化的定制AI模型,该基础架构支持云端、数据中心、工作站和个人电脑的数十亿个GPU。

NVIDIA创始人兼首席执行官黄仁勋强调,企业平台拥有大量数据资源,这些资源可以转化为生成AI助手,从而显著提升商业价值。与合作伙伴共同开发的容器化AI微服务将成为各行业向AI转型的基石。

NIM推理微服务的推出显著缩短了部署时间,将原本需要数周的过程缩短至几分钟。这些微服务基于NVIDIA的推理软件构建预制容器,包括Triton推理服务器和TensorRT-LLM,使开发者能够快速创建和部署AI应用。此外,NIM微服务在语言处理、语音识别和药物发现等领域提供了行业标准API,帮助开发者利用专有数据进行更安全和高效的AI应用开发。

在实际应用中,像ServiceNow这样的公司已经开始使用NIM来加速特定领域助手和生成AI应用的开发。用户可以通过Amazon SageMaker、Google Kubernetes Engine和Microsoft Azure AI等平台访问NIM微服务,并将其与Deepset和LangChain等流行AI框架集成。

除了NIM微服务,CUDA-X微服务还为AI应用开发提供了重要支持。这些微服务为数据准备、定制和训练提供了端到端的构建模块,帮助企业加快生产级AI的开发。通过NVIDIA Riva进行定制语音和翻译AI开发,以及通过NVIDIA cuOpt优化路由,企业能够提升其AI应用的性能和准确性。此外,NeMo Retriever微服务的推出使开发者能够将AI应用与业务数据紧密结合,提升AI助手的精确性和洞察力。

总之,NVIDIA推出的企业级生成AI微服务为企业提供了强大的技术支持和创新动力。这些微服务不仅简化了AI应用的开发和部署流程,还为企业提供了更高的灵活性和性能。随着AI技术的不断发展,这些微服务将在推动AI应用的普及与创新中发挥重要作用。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles