AMD Instinct™ MI250X GPU上のPIConGPUによるシミュレーションの限界への挑戦

2023-08-01更新

宇宙の謎を解き明かすために、科学者たちはプラズマとレーザーの相互作用の内部構造を探求しています。この研究の最前線にいるのは、デラウェア大学のコンピューター・情報科学准教授スニータ・チャンドラセカラン氏と、ドイツのヘルムホルツ・ツェントラム・ドレスデン・ローゼンドルフ（HZDR）の計算レーザープラズマ科学者グループとアレクサンダー・デバス博士が率いる領域専門家チームです。2021年に彼らのプロジェクトについて最後に書いて以来、PIConGPUチームは、GPUアクセラレーションに高度に最適化されたプラズマ物理シミュレーション・システムが搭載された世界で最もパワフルなスーパーコンピューターのいくつかで大規模に実行できるPIConGPUとして知られるコードを使用して、これらの相互作用をシミュレーションするという先駆的な研究で大きな進歩を遂げてきました。研究チームは、AMD Instinct™ MI250X GPUの助けを借りて、物質科学のためのX線光源、がん治療のための放射線治療、そして今日私たちが知っている粒子加速器に革命をもたらす可能性のある画期的な結果を出し続けています。

複雑で大規模なシミュレーションに対応

MI250Xアクセラレータの際立った特徴の1つは、128GBの大容量HBM2eメモリを搭載していることで、これによってより広範で複雑なシミュレーションを処理することができるようになりました。チャンドラセカラン氏は、「SummitのNVIDIA Volta GPUには16GBのHBMメモリが搭載されており、一部のハイメモリノードには32GBのV100が搭載されています。しかし、フロンティアのAMD MI250Xは128GBのメモリを搭載しています。これは、より忠実度の高い問題を解決するのに役立っています」と語ります。

エネルギー効率は、最新のHPCシステムにとって非常に重要な要素であり、注目すべきポイントです。コードが同時に大量の計算リソースを利用できることを重視すると共に、メガワットの電力を過剰に消費しないことも重要な事実であることを忘れてはいけません。チャンドラセカラン氏は「PIConGPUがFrontierの計算能力の98％、つまり約37,000個のAMD Instinct MI250X GPUを使用した場合、Frontierのピーク消費電力が29MWであるのに対し、PIConGPUは21MWの消費電力を維持します。PIConGPUは、ほとんどの実世界のアプリケーションと同様に、実行中ずっと計算だけを行うわけではなく、データ移動や通信といったエネルギー消費の少ない活動も行うためです。」と続けます。

さらに、MI250Xアクセラレータは、PIConGPUシミュレーションで生成される大量のデータを処理できるところも見逃せません。チャンドラセカラン氏はこれについて次のように説明しています。「ペタバイト級のデータを読み書きし、解析することは大きな挑戦です。最初のデータ解析は、データの転送や保存を行う前に、シミュレーション中に非同期で行う必要があります。ここでFrontierが非常に役に立ちます。これは、1ペタバイトもの大規模プラズマ・シミュレーションの現在の状態を保存することさえ可能な、最初のシステムの1つです。」

PIConGPUは、サイエンスケースのシミュレーションにAlpakaバックエンドとPIC（Plasma-in-Cell）アルゴリズムを使用しています。C++17で書かれたオープンソースの抽象化ライブラリであるAlpakaは、基本的な並列レベルを抽象化することにより、アクセラレータ間で性能の移植性を提供しています。AMD HIPおよびAMD ROCm™プラットフォーム上で動作するAlpakaは、PIConGPU内ではなく、ほとんどの移植が行われる場所です。AMD ROCmプラットフォームはオープンソースのソフトウェア・エコシステムであるため、PIConGPUの開発者がソフトウェアの基礎を理解し、バグを報告し、AMDの開発者と交流するのに役立ちます。

PIConGPUシミュレーションが科学的洞察とブレークスルーをもたらす

PIConGPUシミュレーションは、プラズマとレーザーの相互作用の挙動に関する重要な科学的洞察をすでに得ています。特に、このシミュレーションは、新しいレーザープラズマ加速器設計のテストに対して有望であり、ギガ電子ボルトを達成し、テラ電子ボルトにさえ近づいています。これらのブレークスルーは、科学的理解の進展に不可欠な新しい粒子加速器を開発する上で重要な意味を持つと考えられます。

「Frontier上でのPIConGPUシミュレーションによって、これまでにない粒子エネルギーに到達する可能性のある、よりスケーラブルで新しいレーザープラズマ加速器の現実的なモデルを構築することができるのです」と、アレクサンダー・デビュス氏は言います。彼は彼のチームと共に、Frontier上でのシミュレーションに対して、オークリッジ・リーダーシップ・コンピューティング・ファシリティ（OLCF）の2023年INCITE賞を受賞しました。

AMD Instinct MI250X GPUは、PIConGPUのような計算負荷の高いアプリケーションとメモリ負荷の高いアプリケーションの両方を処理できるため、チームはこれまで以上に広範で複雑なシミュレーションを実行できるようになり、プラズマとレーザーの相互作用の挙動に関する重要な洞察を得ることができました。チームは現在、陽子加速プロセスを極めて正確にシミュレートできるようになり、がん患者に対する非常に効果的な陽子線治療法の設計が可能になったのです。現在の放射線治療では、がん部位を取り囲む健康な組織に損傷を与える可能性があるため、これは重要な進展だと言えるでしょう。超短陽子線が腫瘍をより正確に狙い撃ちできるようになれば、患者の予後が改善され、治療の副作用も軽減される可能性があります。

「プラズマベースの陽子加速器によるいわゆるフラッシュ効果は、陽子線治療において非常に大きな可能性を秘めています。その豊富なプラズマダイナミクスを理解し、現在の主要な実験を設計・改良するためには、大規模なレーザー・プラズマシミュレーションが不可欠です」と、HZDRの計算放射線物理学グループリーダーであり、先進システム理解センター（CASUS）の創設マネージャーであるミヒャエル・バスマン氏は説明しています。

次の画像は、HZDRのDRACOレーザーシステムで最近行われた実験のモデルである、高強度レーザービームと相互作用する極低温水素ジェットのPIConGPUシミュレーションです。その過程で、レーザーは水素ジェットを破壊します。膨張するプラズマ電子の雲は強い電流と電磁場を作り出し、陽子加速を引き起こすことになります。この加速された陽子は、将来がん治療に使われる可能性があると考えられています。Alpakaとin-situライブラリISAACプラグインを使用し、1024台のAMD Instinct MI250X GPU上で動作させることで、PIConGPUシミュレーションのライブレンダリングとステアリングが可能になり、これらの機能により、HZDRの開発者は大西洋を越えるような遠隔地からでも操作ができ、シミュレーションを行うことができます。

図1:極低温水素ジェットと高強度レーザービームとの相互作用のPIConGPUシミュレーション。(提供：HZDRのRichard Pausch氏とRene Widera氏）

革新的なパフォーマンスの実現

コードの高速化を測るTUPS（tera updates per second）はPIConGPUシミュレーションの重要な指標となります。Summitでは14.7TUPSを達成したのに対し、Frontierでは65.3TUPSと4.4倍（単精度）の向上を実現しました。この性能向上は、各ノードに4基のMI250X GPU、合計37,600基のMI250X GPUを搭載した9,400台のFrontierノードを使用して達成されています。倍精度を使用した場合の性能向上はさらに顕著で、チームは8.5倍の性能向上を達成しました。PIConGPUのリード・プログラマーであるレネ・ウィドラ氏は、「倍精度では、PIConGPUシミュレーションの実行時間は、単精度での実行時間に比べてわずかに長くなります。AMD Instinct MI250X GPU上のPIConGPUでは、倍精度の追加精度は基本的に無料です」と述べています。

チームは、AMDのハードウェア、ソフトウェア、ツールの専門家と緊密に協力し、フロンティアの可能性を実現し、重要な科学に取り組んできました。これは、ドメイン・サイエンティストとコンピューター・サイエンティスト、AMD、HPE/Cray、ORNLによる、真に協力的で学際的なプロジェクトです。さらに、チャンドラセカラン氏はこの機会を利用して、このプロジェクトに携わる博士課程の学生や学部生など、次世代の人材を育成することにも成功しました。

「MI250Xアクセラレータは、私たちのシミュレーションを大きく変えました」とチャンドラセカラン氏は述べています。チャンドラセカラン氏と彼女のチームが率いる研究は、かつてない規模と解像度のシミュレーションを可能にするハイパフォーマンス・コンピューティングとGPUアクセラレーションの大きな可能性を示しています。AMD Instinct MI250X GPUは、現代科学の最も複雑で本質的な問題に取り組むために必要なメモリ容量、効率性、性能をチームに提供し、これらのブレークスルーにおいて重要な役割を果たしました。

ROCm プラットフォームをより使いやすく

ROCmのユーザと開発者のために、AMDはROCmをより使いやすく、より簡単にシステムに導入できる方法を継続的に模索し、その努力をサポートする学習ツールと技術文書を提供しています。

役立つリソース（※リンク先は英語）：
・ROCm のウェブページでは、プラットフォームの概要とその内容、HPC & AI 市場とサポートするワークロードをご紹介しています。
・ROCm 情報ポータルはユーザと開発者向けのポータルで、ROCm の最新バージョンや API、サポートドキュメントが掲載されています。また、このポータルでは、ROCmプラットフォームを新規ユーザに紹介するためのROCm学習資料や、既存ユーザがROCmプラットフォーム上でシステムを開発・展開する際に役立つ厳選されたビデオ、ウェビナー、ラボ、チュートリアルを提供しています。
・AMD Infinity Hubでは、ROCmがサポートするHPCアプリケーションやMLフレームワークの詳細、最新バージョンの入手方法、インストールドキュメントを提供しています。また、ROCm対応アプリケーションの最新リストを含むROCmアプリケーション・カタログにもアクセスできます。
・最後に、AMD Instinctサーバー・ソリューション・カタログで、AMD Instinct™ MI200シリーズのアクセラレータとパートナー・サーバー・ソリューションの詳細をご覧ください。

本記事の執筆者であるBryce MackinはAMDのシニア・プロダクト・マーケティング・マネージャーです。本記事は彼自身の意見であり、AMDの立場、戦略、意見を代表するものではありません。第三者のサイトへのリンクは便宜上提供されているものであり、明示的に記載されていない限り、AMDはリンク先のサイトのコンテンツについて責任を負わず、いかなる保証も意味するものではありません。

こちらの記事はAMD本社のブログ記事を機械翻訳したものです。詳しくは元記事をご覧ください。

脚注：
本書に記載されている情報は、情報提供のみを目的としており、予告なく変更されることがあります。本書の作成には万全を期していますが、技術的に不正確な記述、省略、誤植が含まれている可能性があり、AMD はこの情報を更新または修正する義務を負いません。Advanced Micro Devices, Inc.は、本書の内容の正確性または完全性に関していかなる表明または保証も行わず、本書に記載されているAMDのハードウェア、ソフトウェア、またはその他の製品の動作または使用に関して、非侵害、商品性、特定目的への適合性の黙示保証を含め、いかなる種類の責任も負いません。禁反言による黙示または起因を含め、本書によって知的財産権に対するライセンスが付与されることはありません。AMD製品の購入または使用に適用される条件および制限は、当事者間の署名された契約書またはAMDの標準販売条件に記載されているとおりです。GD-18
ここに記載されている性能およびコスト削減の主張はすべて、PIConGPUが提供したものであり、AMDが独自に検証したものではありません。性能およびコスト削減効果は、さまざまな変数によって影響を受けます。ここに記載された結果はPIConGPU固有のものであり、典型的なものではない可能性があります。GD-181

一覧に戻る

AMD Instinct™ MI250X GPU上のPIConGPUによるシミュレーションの限界への挑戦

複雑で大規模なシミュレーションに対応

PIConGPUシミュレーションが科学的洞察とブレークスルーをもたらす

革新的なパフォーマンスの実現

ROCm プラットフォームをより使いやすく

ハイブリッドワーク時代に役立つNECのモバイルPC

10万円台から購入できる高コスパモバイルAMD Ryzen™ 5000シリーズ搭載「ThinkPad T14 Gen2」を検証

AMD Instinct™ MI250X GPU上のPIConGPUによるシミュレーションの限界への挑戦

複雑で大規模なシミュレーションに対応

PIConGPUシミュレーションが科学的洞察とブレークスルーをもたらす

革新的なパフォーマンスの実現

ROCm プラットフォームをより使いやすく

関連記事

AMD Instinct MI350シリーズとその先：AIとHPCの未来を加速する

RAGを活用した迅速なAI導入

AMD Ryzen™ AI 300シリーズでAFMF 2と可変グラフィックスメモリを活用したゲーミングパフォーマンスの最大化

AMD Ryzen™ AIとRadeon™ GPUによって加速されたドキュメント チャットで、強力なAIアシスタントを手に入れましょう

世界有数のデータベースがAMD EPYCプロセッサでより優れたパフォーマンスを発揮

AMD、産業用AI対応のNPU搭載 Ryzen™ Embedded 8000シリーズを発表

AMD Ryzen™およびRyzen PRO™プロセッサー 効率計算機でシステムの電力効率を探る

第4世代AMD EPYC™プロセッサーが最新の第5世代Intel® Xeon®プロセッサーを凌駕する

AMD Ryzen™ AIとRadeon™ GPUによって加速されたドキュメントチャットで、強力なAIアシスタントを手に入れましょう

AMD Ryzen™およびRyzen PRO™プロセッサー効率計算機でシステムの電力効率を探る