인공지능 분야에서 기업들은 전례 없는 기회와 도전에 직면하고 있습니다. NVIDIA는 2024년 3월 18일 샌호세 본사에서 빠르고 효율적이며 맞춤형 AI 애플리케이션에 대한 증가하는 수요를 충족하기 위해 여러 기업 수준의 생성적 AI 마이크로서비스를 출시했습니다. 이 마이크로서비스는 개발자에게 맞춤형 생성적 AI 보조기를 생성 및 배포할 수 있는 강력한 플랫폼을 제공하며, 기업의 지식재산권에 대한 완전한 소유와 통제를 보장합니다.
새롭게 도입된 생성적 AI 마이크로서비스는 NVIDIA CUDA 플랫폼을 기반으로 하며, NVIDIA 생태계의 20개 이상의 인기 AI 모델의 추론 성능을 향상시키는 NVIDIA NIM 마이크로서비스를 포함합니다. 사용자는 또한 NVIDIA의 가속화된 소프트웨어 개발 키트, 라이브러리 및 도구를 활용하여 강화된 검색 증강 생성(RAG), 보호 및 고성능 컴퓨팅(HPC) 작업을 수행할 수 있는 NVIDIA CUDA-X 마이크로서비스를 이용할 수 있습니다. 또한, NVIDIA는 의료 분야에 맞춤화된 20개 이상의 전문 NIM 및 CUDA-X 마이크로서비스를 출시하여 의료 분야에서 AI의 잠재적인 응용을 확대했습니다.
이 마이크로서비스는 NVIDIA의 전체 스택 컴퓨팅 플랫폼에 새로운 차원을 제공하며, 모델 개발자, 플랫폼 제공자, 기업 간의 긴밀한 연결을 통해 강력한 AI 생태계를 형성하고 있습니다. 기업들은 수십억 개의 클라우드 GPU, 데이터 센터, 워크스테이션 및 PC에 최적화된 맞춤형 AI 모델을 쉽게 배포할 수 있습니다.
NVIDIA의 창립자이자 CEO인 젠슨 황은 기업 플랫폼이 생성적 AI 보조기로 전환될 수 있는 방대한 데이터 자원을 보유하고 있으며, 이는 상업적 가치를 크게 향상시킬 수 있다고 강조했습니다. 파트너와 협력하여 개발된 컨테이너화된 AI 마이크로서비스는 AI로 전환하는 산업의 초석으로 작용할 것입니다.
NIM 추론 마이크로서비스의 도입은 배포 시간을 극적으로 단축시켜 기존에는 몇 주 걸리던 작업을 몇 분으로 줄였습니다. 이 마이크로서비스는 NVIDIA의 추론 소프트웨어를 기반으로 한 사전 구축된 컨테이너를 제공하여, 개발자들이 AI 애플리케이션을 신속하게 생성하고 배포할 수 있게 합니다. 또한, NIM 마이크로서비스는 언어 처리, 음성 인식 및 약물 발견 등 분야에서 업계 표준 API를 제공하여, 개발자들이 자사 데이터를 사용하여 더 안전하고 효율적인 AI 애플리케이션을 개발할 수 있도록 지원합니다.
실제 적용 사례로, ServiceNow와 같은 기업들은 이미 NIM을 사용하여 도메인 특정 보조기 및 생성적 AI 애플리케이션 개발을 가속화하고 있습니다. 사용자들은 Amazon SageMaker, Google Kubernetes Engine, Microsoft Azure AI와 같은 플랫폼을 통해 NIM 마이크로서비스에 접근하고, Deepset 및 LangChain과 같은 인기 AI 프레임워크와 통합할 수 있습니다.
NIM 마이크로서비스 외에도 CUDA-X 마이크로서비스는 AI 애플리케이션 개발에 상당한 지원을 제공합니다. 이 마이크로서비스는 데이터 준비, 맞춤화 및 훈련을 위한 엔드 투 엔드 빌드 모듈을 제공하여 기업이 프로덕션 수준의 AI 개발을 가속화하도록 도와줍니다. 맞춤형 음성 및 번역 AI 개발을 위한 NVIDIA Riva와 라우팅 최적화를 위한 NVIDIA cuOpt를 통해 기업들은 AI 애플리케이션의 성능과 정확성을 향상시킬 수 있습니다. 또한, NeMo Retriever 마이크로서비스의 출시는 개발자들이 AI 애플리케이션과 비즈니스 데이터를 밀접하게 연결하여 AI 보조기의 정확성과 통찰력을 개선할 수 있게 합니다.
결론적으로, NVIDIA의 기업 수준 생성적 AI 마이크로서비스 출시는 기업에 강력한 기술 지원과 혁신적인 동력을 제공합니다. 이 마이크로서비스는 AI 애플리케이션의 개발 및 배포 프로세스를 간소화할 뿐만 아니라, 기업에 유연성과 성능을 제공합니다. AI 기술이 계속 진화함에 따라, 이 마이크로서비스는 AI 애플리케이션의 확산과 혁신을 진전시키는 중요한 역할을 할 것입니다.