Dans le domaine de l'intelligence artificielle, les entreprises font face à des opportunités et des défis sans précédent. Pour répondre à la demande croissante d'applications IA rapides, efficaces et personnalisées, NVIDIA a lancé plusieurs microservices d'IA générative de niveau entreprise le 18 mars 2024, à son siège de San Jose, en Californie. Ces microservices visent à fournir aux développeurs une plateforme robuste pour créer et déployer des assistants IA génératifs sur mesure, tout en garantissant une pleine propriété et un contrôle de la propriété intellectuelle pour les entreprises.
Les nouveaux microservices d'IA générative reposent sur la plateforme NVIDIA CUDA et incluent les microservices NVIDIA NIM, qui améliorent la performance d’inférence de plus de 20 modèles d'IA populaires au sein de l'écosystème NVIDIA. Les utilisateurs peuvent également tirer parti des microservices NVIDIA CUDA-X pour l'utilisation des kits de développement logiciel, bibliothèques et outils accélérés de NVIDIA, pour des tâches telles que la génération augmentée par récupération (RAG), la sécurisation et le calcul haute performance (HPC). De plus, NVIDIA a déployé plus de 20 microservices NIM et CUDA-X spécialisés pour le secteur médical, élargissant ainsi les applications potentielles de l'IA dans le secteur de la santé.
Ces microservices apportent une nouvelle dimension à la plateforme informatique full-stack de NVIDIA, reliant étroitement les développeurs de modèles, les fournisseurs de plateformes et les entreprises pour créer un écosystème IA puissant. Les entreprises peuvent facilement déployer des modèles IA personnalisés optimisés pour une installation sur la base NVIDIA CUDA, qui comprend des milliards de GPU dans le cloud, les centres de données, les stations de travail et les PC.
Le fondateur et PDG de NVIDIA, Jensen Huang, a souligné que les plateformes d'entreprise possèdent d'importantes ressources de données pouvant être transformées en assistants IA génératifs, augmentant considérablement la valeur commerciale. Les microservices d'IA en conteneurs, développés en collaboration avec des partenaires, serviront de pierre angulaire pour les secteurs en transition vers l'IA.
L'introduction des microservices d'inférence NIM réduit considérablement les temps de déploiement, condensant ce qui prenait auparavant des semaines en quelques minutes. Ces microservices offrent des conteneurs préconçus basés sur le logiciel d’inférence de NVIDIA, y compris le serveur d'inférence Triton et TensorRT-LLM, permettant aux développeurs de créer et déployer rapidement des applications IA. De plus, les microservices NIM fournissent des API standard de l'industrie dans des domaines tels que le traitement du langage, la reconnaissance vocale et la découverte de médicaments, permettant aux développeurs d'utiliser des données propriétaires pour un développement d'applications IA plus sécurisé et efficace.
En pratique, des entreprises comme ServiceNow ont déjà commencé à utiliser NIM pour accélérer le développement d'assistants spécifiques à leur domaine et d'applications IA génératives. Les utilisateurs peuvent accéder aux microservices NIM via des plateformes comme Amazon SageMaker, Google Kubernetes Engine et Microsoft Azure AI, les intégrant avec des frameworks IA populaires tels que Deepset et LangChain.
En plus des microservices NIM, les microservices CUDA-X offrent également un soutien substantiel pour le développement d'applications IA. Ces microservices fournissent des modules de construction de bout en bout pour la préparation des données, la personnalisation et l'entraînement, aidant les entreprises à accélérer le développement d'applications IA de niveau production. Avec NVIDIA Riva pour le développement d’IA vocale personnalisée et de traduction et NVIDIA cuOpt pour l'optimisation des itinéraires, les entreprises peuvent améliorer la performance et la précision de leurs applications IA. De plus, le lancement du microservice NeMo Retriever permet aux développeurs de relier étroitement les applications IA aux données commerciales, améliorant ainsi la précision et les insights des assistants IA.
En résumé, le lancement de microservices d'IA générative de niveau entreprise par NVIDIA dote les entreprises d'un soutien technologique puissant et d'un élan innovant. Ces microservices non seulement simplifient les processus de développement et de déploiement des applications IA, mais offrent également une flexibilité et des performances accrues pour les entreprises. Alors que la technologie IA continue d'évoluer, ces microservices sont prêts à jouer un rôle significatif dans l'avancement et l'innovation des applications d'IA.