Intelは、AI開発を促進し、ワークフローを効率化し、インフラを簡素化し、企業の負荷を加速するために設計された次世代AI処理チップ「Gaudi 3 AIアクセラレーター」を発表しました。Gaudi 3は前代のアーキテクチャを踏襲しつつ、計算能力は4倍、ネットワーク帯域幅は倍増、ハイバンド幅メモリ(HBM)の容量は1.5倍に向上し、大規模言語モデル(LLM)の増加する要求にも応える性能を持っています。
元々はグラフィック処理ユニット(GPU)技術に基づいたGaudi 3の並列処理能力とマルチタイルアーキテクチャは、AIアクセラレーターとして非常に適しています。この発表は、IntelがAIアクセラレーター市場でNvidiaやAMDと競争する戦略の一環です。IntelのCEOパトリック・ゲルシンガー氏は、AI EverywhereイベントでGaudi 3をプレビューし、このチップが本日正式に発表される一方、一般公開は2024年第3四半期に予定されていると述べました。一部の顧客はすでにサンプルを受け取っています。
IntelのデータセンターAIソリューション担当副社長、ジェニ・バロビアン氏は、「生成AIはコンピュータの根本的な変革を表しています」と述べ、Gaudi 3が将来のAIシステム構築に必要な性能、スケーラビリティ、効率を提供することを強調しました。
Gaudi 3の仕様と性能
IntelのハバナラボのCOO、エイタン・メディナ氏は、Gaudi 3は64個のテンソルプロセッサコア(第5世代)、8つのマトリックス数学エンジン、128GBのHBM容量(帯域幅3.7TB/s)、24の200GbE RoCEイーサネットポートを備えた異種コンピュータアーキテクチャを特徴とすると説明しています。
Gaudi 3によるソリューション構築は、Gaudi 2と同様に簡単であり、Intelは各アクセラレーターあたりのネットワーク帯域幅を倍増させ、推論、ファインチューニング、トレーニングに基づいた広範なクラスター構成が可能になります。
Nvidia GPUとの比較
NvidiaのH100と比較すると、Gaudi 3は大規模言語モデルのトレーニングタスクにおいて最大1.7倍の速度向上が予測されています。また、Llama-7BやFalcon 180Bを用いた推論テストでは、Gaudi 3はH100より1.5倍、最新のH200より1.3倍の速度を発揮したと報告されています。特に、Gaudi 3は推論タスクにおいて、H100の2.3倍の電力効率を示しています。
製品ラインナップ
IntelはGaudi 3チップだけでなく、以下の3つの補完製品も発表しています:
1. Gaudi 3 AIアクセラレータカード (HL-325L):OAM準拠、1,835 TFLOPs、128GBのHBM2eを搭載。
2. ユニバーサルベースボード (HLB-325):14.6 PFLOPS以上、1TB以上のHBM2eを搭載。
3. PCI Expressアドインカード:パッシブ冷却デザインでデュアルスロットを装備し、同等の性能指標を提供。
企業におけるAIの未来
IntelのGaudi 3は、企業レベルの課題に応えます。ネットワークおよびエッジグループのシニアVP、サチン・カッティ氏は、「AIエージェントが複雑なワークフローを自律的に処理する時代に突入している」と述べ、次のAIの段階では、これらのエージェントが独自のデータを活用し、業界全体にわたる大きな変革の礎を築くとしています。
カッティ氏は、非構造的で独自のデータをAIシステムに統合する課題を指摘し、しばしばCPU依存でさまざまな形式に散らばっていると述べています。彼は、企業がさまざまな互換性のあるAIソリューションから選択できるモジュラーで安全なエコシステムを提唱し、信頼性を確保し、バイアスを軽減する責任ある展開を重視しています。
IntelはGaudiの強化された能力を活用してNvidiaエコシステムから顧客を引き寄せることを目指しており、AIコストが上昇する中、成長が見込まれるAIチップ市場において代替手段としての地位を確立しています。
結論
生成AIがコンピュータの重要な瞬間を迎える中、IntelのGaudi 3は企業のAI導入を変革するための競争力ある性能と効率を提供します。同社のオープンスタンダードとシステム互換性への取り組みは、進化するAIの風景をサポートすることを強調しており、AIの力を活用したい多様な企業のニーズに応えることが期待されています。