Im Bereich der künstlichen Intelligenz stehen Unternehmen vor beispiellosen Chancen und Herausforderungen. Um der wachsenden Nachfrage nach schnellen, effizienten und maßgeschneiderten KI-Anwendungen gerecht zu werden, hat NVIDIA am 18. März 2024 mehrere generative KI-Mikrodienste auf Unternehmensebene in seinem Hauptsitz in San Jose, Kalifornien, eingeführt. Diese Mikrodienste bieten Entwicklern eine leistungsstarke Plattform zur Erstellung und Bereitstellung individueller generativer KI-Assistenten und sichern gleichzeitig die vollständige Kontrolle über geistiges Eigentum für Unternehmen.
Die neu eingeführten generativen KI-Mikrodienste basieren auf der NVIDIA CUDA-Plattform und umfassen die NVIDIA NIM-Mikrodienste, die die Inferenzleistung von über 20 beliebten KI-Modellen im NVIDIA-Ökosystem verbessern. Nutzer können auch die NVIDIA CUDA-X-Mikrodienste nutzen, um NVIDIAs beschleunigte Software Development Kits, Bibliotheken und Tools für Aufgaben wie verbesserte retrieval-augmented generation (RAG), Sicherheitslösungen und Hochleistungsrechnen (HPC) einzusetzen. Darüber hinaus hat NVIDIA mehr als 20 spezialisierte NIM- und CUDA-X-Mikrodienste für den medizinischen Sektor eingeführt, was das Potenzial für KI-Anwendungen im Gesundheitswesen weiter ausbaut.
Diese Mikrodienste bieten eine neue Dimension der vollständigen Rechenplattform von NVIDIA und verknüpfen Modellentwickler, Plattformanbieter und Unternehmen, um ein starkes KI-Ökosystem zu schaffen. Unternehmen können problemlos maßgeschneiderte KI-Modelle bereitstellen, die für die Installation auf der NVIDIA CUDA-Basis optimiert sind, die Milliarden von GPUs in der Cloud, in Rechenzentren, auf Workstations und PCs umfasst.
NVIDIAs Gründer und CEO, Jensen Huang, betonte, dass Unternehmensplattformen über umfangreiche Datenressourcen verfügen, die in generative KI-Assistenten umgewandelt werden können, was den kommerziellen Wert erheblich steigert. Die containerisierten KI-Mikrodienste, die in Zusammenarbeit mit Partnern entwickelt wurden, werden zur Grundpfeiler für Branchen, die auf KI umsteigen.
Die Einführung der NIM-Inferenz-Mikrodienste verkürzt die Bereitstellungszeiten erheblich und reduziert das, was früher Wochen dauerte, auf nur Minuten. Diese Mikrodienste bieten vorgefertigte Container basierend auf NVIDIAs Inferenzsoftware, einschließlich des Triton-Inferenzservers und TensorRT-LLM, sodass Entwickler KI-Anwendungen schnell erstellen und bereitstellen können. Zudem bieten NIM-Mikrodienste branchenübliche APIs in Bereichen wie Sprachverarbeitung, Spracherkennung und Arzneimittelforschung, wodurch Entwickler proprietäre Daten für die sicherere und effizientere Entwicklung von KI-Anwendungen nutzen können.
In der Praxis haben Unternehmen wie ServiceNow bereits begonnen, NIM zur Beschleunigung der Entwicklung von domänenspezifischen Assistenten und generativen KI-Anwendungen zu nutzen. Nutzer können auf NIM-Mikrodienste über Plattformen wie Amazon SageMaker, Google Kubernetes Engine und Microsoft Azure AI zugreifen und diese mit populären KI-Frameworks wie Deepset und LangChain integrieren.
Neben NIM-Mikrodiensten bieten auch CUDA-X-Mikrodienste umfassende Unterstützung für die Entwicklung von KI-Anwendungen. Diese Mikrodienste liefern End-to-End-Bausteine für Datenvorbereitung, Anpassung und Training und helfen Unternehmen, die Entwicklung von produktionsreifen KI-Anwendungen zu beschleunigen. Mit NVIDIA Riva für die Entwicklung benutzerdefinierter Sprach- und Übersetzungs-KI und NVIDIA cuOpt für Routing-Optimierung können Unternehmen die Leistung und Genauigkeit ihrer KI-Anwendungen verbessern. Außerdem ermöglicht der Start des NeMo Retriever-Mikrodienstes Entwicklern, KI-Anwendungen eng mit Geschäftsdaten zu verknüpfen und so die Präzision und Erkenntnisse von KI-Assistenten zu verbessern.
Zusammenfassend rüstet die Einführung von generativen KI-Mikrodiensten auf Unternehmensebene durch NVIDIA Unternehmen mit leistungsstarker technologischer Unterstützung und innovativem Schwung aus. Diese Mikrodienste vereinfachen nicht nur die Entwicklungs- und Bereitstellungsprozesse von KI-Anwendungen, sondern bieten auch verbesserte Flexibilität und Leistung für Unternehmen. Mit der fortschreitenden Entwicklung der KI-Technologie sind diese Mikrodienste bereit, eine bedeutende Rolle bei der Verbreitung und Innovation von KI-Anwendungen zu spielen.