人工知能の世界では、企業は前例のない機会と課題に直面しています。2024年3月18日、カリフォルニア州サンノゼの本社で、NVIDIAは迅速かつ効率的、かつカスタマイズ可能なAIアプリケーションの需要に応えるため、いくつかの企業向け生成AIマイクロサービスを発表しました。これらのマイクロサービスは、開発者に堅牢なプラットフォームを提供し、カスタマイズした生成AIアシスタントを作成・展開できるように設計されており、企業が知的財産を完全に所有し、管理することを保証します。
新たに導入された生成AIマイクロサービスは、NVIDIAのCUDAプラットフォームに基づいて構築されており、NVIDIAエコシステム内の20以上の人気AIモデルの推論性能を向上させるNVIDIA NIMマイクロサービスを含んでいます。また、ユーザーはNVIDIAの加速されたソフトウェア開発キットやライブラリ、ツールを活用し、強化された検索拡張生成(RAG)、セキュリティ、高性能コンピューティング(HPC)などのタスクを実行できます。さらに、NVIDIAは医療分野向けに特化したNIMおよびCUDA-Xマイクロサービスを20以上展開し、ヘルスケアにおけるAIの応用可能性をさらに広げています。
これらのマイクロサービスは、NVIDIAのフルスタックコンピューティングプラットフォームに新たな次元を与え、モデル開発者、プラットフォーム提供者、企業の密接な連携を促進し、強力なAIエコシステムを構築します。企業はNVIDIA CUDAベースに最適化されたカスタマイズAIモデルを容易に展開でき、クラウド、データセンター、ワークステーション、PCにある数十億のGPUを活用できます。
NVIDIAの創設者兼CEOであるジェンスン・ホアン氏は、企業のプラットフォームが持つ膨大なデータ資源を利用することで、生成AIアシスタントに変換できる可能性があり、その商業価値を大きく向上させることができると強調しました。パートナーと共同開発されたコンテナ化されたAIマイクロサービスは、AIへの移行を求める業界の礎となるでしょう。
NIM推論マイクロサービスの導入により、展開時間が大幅に短縮され、従来の数週間がわずか数分に縮まりました。これらのマイクロサービスは、NVIDIAの推論ソフトウェア(Triton推論サーバーやTensorRT-LLMを含む)に基づいたプリビルドコンテナを提供し、開発者が迅速にAIアプリケーションを作成・展開できるようにします。また、NIMマイクロサービスは、言語処理、音声認識、医薬品発見などの分野で業界標準のAPIを提供し、開発者が独自のデータを使用して、より安全で効率的なAIアプリケーションの開発を進められるようにします。
実際には、ServiceNowのような企業がすでにNIMを活用して、特定のドメイン向けアシスタントや生成AIアプリケーションの開発を加速させています。ユーザーは、Amazon SageMakerやGoogle Kubernetes Engine、Microsoft Azure AIなどのプラットフォームを通じてNIMマイクロサービスにアクセスでき、DeepsetやLangChainといった人気のAIフレームワークと統合できます。
NIMマイクロサービスだけでなく、CUDA-XマイクロサービスもAIアプリケーション開発に大きな支援を提供します。これらのマイクロサービスは、データ準備、カスタマイズ、トレーニングのためのエンドツーエンドのビルドモジュールを提供し、企業の製品レベルのAI開発を加速させます。カスタム音声生成や翻訳のAI開発に向けたNVIDIA Riva、ルーティング最適化に向けたNVIDIA cuOptを使用することで、企業はAIアプリケーションの性能や精度を向上させることができます。さらに、NeMo Retrieverマイクロサービスの導入により、開発者はAIアプリケーションとビジネスデータを密接にリンクさせ、AIアシスタントの精度や洞察を向上させることが可能です。
要約すると、NVIDIAの企業向け生成AIマイクロサービスの発表は、企業に強力な技術支援と革新的なモメンタムを提供します。これらのマイクロサービスは、AIアプリケーションの開発と展開プロセスを簡素化し、企業にとっての柔軟性やパフォーマンスを向上させます。AI技術が進化し続ける中、これらのマイクロサービスはAIアプリケーションの普及と革新を促進する上で重要な役割を果たすことでしょう。