在人工智慧領域,各公司面臨前所未有的機會與挑戰。為滿足對快速、高效及客製化AI應用日益增長的需求,NVIDIA於2024年3月18日在加州聖荷西總部發布了多項企業級生成AI微服務。這些微服務旨在為開發者提供強大的平台,以創建和部署量身訂製的生成AI助手,同時保護企業的知識產權和完全控制權。
新推出的生成AI微服務建立在NVIDIA CUDA平台之上,包含NVIDIA NIM微服務,這些微服務提升了NVIDIA生態系統中超過20個受歡迎的AI模型的推理性能。用戶還可以利用NVIDIA的CUDA-X微服務,使用加速的軟體開發工具包、庫及工具,進行強化檢索增強生成(RAG)、資料保護及高效能運算(HPC)等任務。此外,NVIDIA還針對醫療領域推出了超過20個專門的NIM和CUDA-X微服務,進一步拓展AI在醫療保健中的應用潛力。
這些微服務為NVIDIA的全堆疊計算平台增添了新的維度,緊密聯繫模型開發者、平台供應商與企業,形成強大的AI生態系統。企業可以輕鬆部署針對NVIDIA CUDA基礎的優化客製化AI模型,該基礎包括雲端、數據中心、工作站及PC中的數十億顆GPU。
NVIDIA創始人兼CEO黃仁勳強調,企業平台擁有龐大的數據資源,可以轉化為生成AI助手,顯著提升商業價值。與合作夥伴共同開發的容器化AI微服務將成為行業轉型至AI的基石。
NIM推理微服務顯著縮短了部署時間,將以往需要數周的時間縮短至幾分鐘。這些微服務提供基於NVIDIA推理軟體的預建容器,包括Triton推理伺服器和TensorRT-LLM,使開發者能快速創建和部署AI應用。此外,NIM微服務還在語言處理、語音識別和藥物發現等領域提供行業標準API,幫助開發者利用專有數據進行更安全高效的AI應用開發。
在實際應用中,ServiceNow等公司已經開始使用NIM,以加速特定領域助手和生成AI應用的開發。用戶可以通過Amazon SageMaker、Google Kubernetes Engine及Microsoft Azure AI等平台訪問NIM微服務,並將其與Deepset和LangChain等流行AI框架整合。
除了NIM微服務,CUDA-X微服務也為AI應用開發提供了強大的支持。這些微服務提供了從數據準備、客製化到訓練的端到端構建模塊,幫助企業加速生產級AI的開發。借助NVIDIA Riva進行自訂語音和翻譯AI開發,以及NVIDIA cuOpt進行路由優化,企業能提升AI應用的性能和準確性。此外,NeMo Retriever微服務的推出使開發者能夠更密切地將AI應用與業務數據聯繫起來,改善AI助手的精確度和洞察力。
總之,NVIDIA推出的企業級生成AI微服務為企業提供了強大的技術支持和創新動力。這些微服務不僅簡化了AI應用的開發和部署過程,同時為企業提供了更高的靈活性和性能。隨著AI技術的持續演進,這些微服務注定將在推動AI應用的普及與創新中發揮重要作用。