生成的AIでROIを引き出す: 成功のための戦略
生成的AIは、業界全体で年間2.6兆ドルから4.4兆ドルのROIポテンシャルを持っています。しかし、その活用には膨大な計算リソースとインフラが必要です。NVIDIAとSupermicroの専門家たちが、重要なユースケースの特定方法とAI対応プラットフォームの構築について明らかにします。
生成的AIの導入がもたらす利点
ビジネス業務に生成的AIを取り入れることは単なる利点にとどまらず、かつてないほどのコンピューティング、ネットワーク、ストレージリソースを必要とします。データへの効率的なアクセス、事前にトレーニングされたモデルのカスタマイズ、スケールでの運用を実現するには、包括的なAI対応ハードウェアとソフトウェアのエコシステム、さらには専門的な技術力が不可欠です。
業界の専門家から学ぶ
NVIDIAのシニアプロダクトマーケティングマネージャー、アントニー・ラリジャニと、Supermicroのシニアプロダクトマーケティングマネージャー、近藤祐介が、OctoMLの共同創設者でCEOのルイス・セゼによるモデレーションで、生成的AIを活用するための戦略について議論します。彼らはインフラの重要な決定、ワークロードの考慮事項、そして組織におけるAI戦略の最適化に焦点を当てます。
インフラとワークロードの整合性
インフラを組織のニーズと整合させることは極めて重要です。ラリジャニは「インフラがサポートするワークロードを理解することから始めましょう。大規模な基盤モデルとリアルタイムアプリケーションでは、計算要件が大きく異なります」と述べています。
ワークロードを評価する際には、スケーラビリティを考慮しましょう。バッチ処理かリアルタイムインタラクション(チャットボットなど)の場合、潜在的なアプリケーションの需要を見積もります。
クラウド vs. オンプレミスソリューション
生成的AIアプリケーションはしばしばスケーリングが必要となり、クラウドとオンプレミスのソリューションについて議論が生じます。近藤は「特定のユースケースと要求されるスケールによります」と強調します。クラウドはスケーリングの柔軟性を提供しますが、オンプレミスのソリューションは予見と大規模な初期投資が求められます。
「プロジェクトの潜在的なスケールを評価してください。GPUクラウドを利用する方がコスト効果が高いですか?」と彼は問いかけ、クラウドコストが下降し、計算能力が向上していることを指摘します。
オープンソース vs. 専有モデル
企業内でのカスタマイズされた専門モデルへの関心が高まっています。ラリジャニは「情報検索を強化する生成技術により、企業が専有データを効率的に活用できるようになり、それがインフラ選択に影響を与えています」と述べます。モデルをカスタマイズすることで、トレーニングコストと時間が削減されます。
「特定のニーズに基づいて基盤モデルを微調整することが、コスト効率とGPUの利用率を向上させます」と近藤は付け加えます。
総合的なソフトウェアスタックでハードウェアを最大限に活用
ハードウェアを最適化するには、高度なソフトウェアスタックも必要です。近藤は「大規模なインフラは複雑で、設計段階からNVIDIAの専門家との協力が求められます」と述べています。
完全なAIソフトウェアスタックを構築するには多くのリソースが必要であるため、NVIDIAはフルスタックコンピューティング企業へと移行しています。NVIDIA AIエンタープライズプラットフォームの一部であるNemoフレームワークは、企業が生成的AIモデルを最適に構築、カスタマイズ、展開する手助けをします。
LLMの複雑性に備える未来志向
大規模言語モデル(LLM)が成長するにつれ、それに伴いエネルギー需要も増加しています。近藤は「GPUに期待される電力が急速に増加しています」と指摘し、エネルギー効率を最適化するための冷却ソリューションの革新が進んでいると述べます。また、ラリジャニは、コスト効率と持続可能性を考慮しながら、展開効率を高めるための新しいソフトウェア開発技術に言及しています。
「企業の規模に関わらず最適化システムへの需要が高まっており、新たなAIのユースケースが頻繁に出現しています」と彼は述べ、継続的なソフトウェアの改善の重要性を強調しています。