アマゾンのクラウドサービス、AWSは新しいマネージドプロダクトであるAWS Parallel Computing Serviceを通じて、高性能コンピューティング(HPC)へのアクセスを民主化しようとしています。このサービスにより、AWSの顧客は専任のシステム管理者を必要とせず、大規模な計算集約型ワークロードに対して強力なコンピュータサーバーを利用できるようになります。
AWSの先進コンピュートおよびシミュレーションディレクター、イアン・コール氏によると、この新しいアクセスは、伝統的にHPCクラスターに依存していた技術革新と科学的発見のスピードを大幅に向上させる可能性があります。「多くの既存のワークロードは高性能コンピューティングリソースから恩恵を受けられますが、それが大企業向けだけという認識が探求を妨げていることが多いです」とコール氏は説明します。彼は、この新サービスの利用を通じて、企業がHPCクラスターの使用の容易さを発見し、実験を促進すると信じています。「私たちは管理負担を軽減し、HPCクラスターに多額の資本投資を必要としないようにしています。今では、AWSアカウントさえあれば、実験を行ってワークロードのスケールを評価することができます」と彼は付け加えました。
サービスの提供内容
AWS Parallel Computingは、ユーザーがAmazonのElastic Compute Cloudインスタンスのグループを設定・管理できるようにします。このサービスは、オープンソースのHPCワークロードマネージャーSlurmを利用し、クラスターの維持管理を円滑に行えるようにし、専任のシステム管理者を必要なくしています。これまで、AWSはHPCクラスターへのアクセスを提供していましたが、ユーザーが自分で管理リソースを管理する必要がありました。現在、科学や工学のワークロードを拡大したい顧客は、AWS上で管理コンソールやソフトウェア開発キットなどお馴染みのツールを利用できます。Slurmの統合により、ユーザーは既存のワークフローを再構築することなく、AWS HPCクラスターにシームレスに移行できます。企業はまた、APIを簡単につなげることができます。
コール氏は、AWSの提供がクラスター管理を簡素化し、顧客がSlurmの管理を完全にサービスに委託できることを強調しました。
利用可能地域
このサービスは、最初にアメリカのオハイオ州、バージニア州北部、オレゴン州、ヨーロッパのフランクフルト、ストックホルム、アイルランド、およびアジア太平洋地区のシドニー、シンガポール、東京など複数のAWSリージョンで利用可能です。ドイツのMarvel Fusionなどの一部AWS顧客は、HPCクラスターの様々なユースケースを紹介するために早期アクセスを得ています。Marvel Fusionは、無限のゼロエミッションエネルギーの研究にこのサービスを使用し、オーストラリアのRoninはクラウド上でHPCシミュレーションに活用しています。
HPCクラスターの需要拡大
HPCクラスターの需要は、企業が大規模なAIモデルのトレーニングやその他のAI基盤に計算能力をますます依存する中で急増しています。HPCネットワークは、創薬などの重要な計算に加え、さまざまなAIワークロードにとっても不可欠です。
従来、スーパコンピュータは主要な政府の研究室や大企業にのみアクセス可能でしたが、AMD、Intel、Nvidia、IBMなどのハードウェアメーカーがこれらのクライアント向けに高速システムを競って開発していました。しかし、多様な企業からの関心が高まる中、AWSやGoogle、Microsoft Azure、Penguin Computing on Demandのようなクラウドプロバイダーから「HPC-as-a-service」の提供が急成長しています。
ガートナーのアナリスト、トニー・ハーヴィー氏は、HPC-as-a-serviceは新しい概念ではありませんが、利用ケースの進化がより多くの企業にスーパコンピュータへのアクセスを求めさせていると指摘しています。「今後、この分野で競争が激化する可能性が高いです。特にHPCの利用がAIに限らず広がっているためです」とハーヴィー氏は述べました。彼は、HPC資源へのアクセスを民主化することで、テネシー州のヒューレット・パッカードのFrontierユニットのような高性能スーパコンピュータの待機時間を短縮できると付け加えました。「これにより、新しいユーザーも資源にアクセスできるようになり、研究者や実務者が実験や予測モデルに取り組む際の時間の価値を最大化できます」とハーヴィー氏は結論づけました。