En el ámbito de la inteligencia artificial, las empresas enfrentan oportunidades y desafíos sin precedentes. Para satisfacer la creciente demanda de aplicaciones de IA rápidas, eficientes y personalizadas, NVIDIA lanzó el 18 de marzo de 2024 varios microservicios de IA generativa a nivel empresarial en su sede de San José, California. Estos microservicios están diseñados para proporcionar a los desarrolladores una plataforma robusta para crear y desplegar asistentes de IA generativa a medida, asegurando al mismo tiempo la plena propiedad y control de la propiedad intelectual para las empresas.
Los recién introducidos microservicios de IA generativa están basados en la plataforma NVIDIA CUDA e incluyen microservicios NVIDIA NIM, que mejoran el rendimiento de inferencia de más de 20 modelos de IA populares dentro del ecosistema de NVIDIA. Los usuarios también pueden aprovechar los microservicios NVIDIA CUDA-X para utilizar los kits de desarrollo de software, bibliotecas y herramientas aceleradas de NVIDIA para tareas como la generación aumentada de recuperación (RAG), la protección de datos y la computación de alto rendimiento (HPC). Además, NVIDIA ha lanzado más de 20 microservicios NIM y CUDA-X especializados para el sector médico, ampliando aún más las aplicaciones potenciales de la IA en la atención sanitaria.
Estos microservicios añaden una nueva dimensión a la plataforma informática completa de NVIDIA, conectando estrechamente a desarrolladores de modelos, proveedores de plataformas y empresas para crear un poderoso ecosistema de IA. Las empresas pueden desplegar fácilmente modelos de IA personalizados optimizados para su instalación en la base NVIDIA CUDA, que incluye miles de millones de GPUs en la nube, centros de datos, estaciones de trabajo y PC.
El fundador y CEO de NVIDIA, Jensen Huang, subrayó que las plataformas empresariales poseen recursos de datos vastos que pueden transformarse en asistentes de IA generativa, aumentando significativamente el valor comercial. Los microservicios de IA en contenedores, desarrollados en colaboración con socios, servirán como base para las industrias en transición hacia la IA.
La introducción de microservicios de inferencia NIM reduce drásticamente los tiempos de despliegue, condensando lo que antes tomaba semanas en apenas minutos. Estos microservicios ofrecen contenedores preconstruidos basados en el software de inferencia de NVIDIA, incluyendo el servidor de inferencia Triton y TensorRT-LLM, permitiendo a los desarrolladores crear y desplegar rápidamente aplicaciones de IA. Además, los microservicios NIM ofrecen APIs estándar en áreas como procesamiento de lenguaje, reconocimiento de voz y descubrimiento de fármacos, permitiendo a los desarrolladores utilizar datos propietarios para un desarrollo más seguro y eficiente de aplicaciones de IA.
En aplicaciones prácticas, empresas como ServiceNow ya han comenzado a utilizar NIM para acelerar el desarrollo de asistentes específicos de dominio y aplicaciones de IA generativa. Los usuarios pueden acceder a los microservicios NIM a través de plataformas como Amazon SageMaker, Google Kubernetes Engine y Microsoft Azure AI, integrándolos con marcos de IA populares como Deepset y LangChain.
Además de los microservicios NIM, los microservicios CUDA-X también brindan un apoyo considerable para el desarrollo de aplicaciones de IA. Estos microservicios ofrecen módulos de construcción de extremo a extremo para la preparación de datos, personalización y entrenamiento, ayudando a las empresas a acelerar el desarrollo de IA a nivel de producción. Con NVIDIA Riva para el desarrollo de voz e IA de traducción personalizadas y NVIDIA cuOpt para la optimización de rutas, los negocios pueden mejorar el rendimiento y la precisión de sus aplicaciones de IA. Asimismo, el lanzamiento del microservicio NeMo Retriever permite a los desarrolladores vincular estrechamente las aplicaciones de IA con datos empresariales, mejorando la precisión y los conocimientos de los asistentes de IA.
En resumen, el lanzamiento de microservicios de IA generativa a nivel empresarial por parte de NVIDIA proporciona a las empresas un sólido apoyo tecnológico y un impulso innovador. Estos microservicios no solo simplifican los procesos de desarrollo y despliegue de aplicaciones de IA, sino que también ofrecen flexibilidad y rendimiento mejorados para las empresas. A medida que la tecnología de IA continúa evolucionando, estos microservicios están preparados para desempeñar un papel significativo en la proliferación e innovación de aplicaciones de IA.