第4世代AMD EPYC™プロセッサーが最新の第5世代Intel® Xeon®プロセッサーを凌駕する

AMD EPYC™ プロセッサー

2024-09-30更新

  • twitter
  • facebook
  • line

第5世代インテル® Xeon® プロセッサーの発売により、第4世代AMD EPYC™プロセッサーとの比較を通じて、さまざまな重要なワークロードに対する性能評価を行う絶好の機会が訪れました。AMDはデータセンターのパフォーマンス、電力効率、そしてコスト効果において、競合を凌駕し続けています。AMD EPYCプロセッサーは、300以上の世界記録を持つ性能を誇り、インテルの最新リリースが我々のリーダーシップポジションを揺るがすことはありません。この成功は、250以上のサーバーデザインと800を超えるクラウドインスタンスを擁する、強力なAMD EPYCエコシステムによって支えられています。

一般的な用途向けおよび高周波数モデルの第4世代AMD EPYCプロセッサーが、第5世代インテルXeonスケーラブルプロセッサーと、電力効率および広範なワークロードにおいて匹敵する競争力を備えていると発表できることを、嬉しく思います。これには、基盤的なワークロード、仮想化インフラ、意思決定支援システム、ビジネスアプリケーション、計算流体力学(CFD)、有限要素解析(FEA)、分子動力学、量子化学、そして気象予測などが含まれます。

1. SPEC Powerでの電力効率

現代のデータセンターは、急速に増大する需要に対応しつつ、電力使用量を最適化してコストを抑え、持続可能な目標を達成しようとしています。Standard Performance Evaluation Corporation(SPEC®)のSPECpower_ssj® 2008ベンチマークは、システムのパワーとパフォーマンス特性を評価することで、ボリュームサーバークラスコンピュータのエネルギー効率の比較指標を提供します。SPECpower®ベンチマークは、単一サーバーおよびマルチノードサーバーのパワーとパフォーマンス特性を評価する、業界初の標準ベンチマークです。

SPECpower_ssj® 2008ベンチマークの定義された測定基準により、顧客は様々な構成やサーバーでエネルギー効率を比較できます。このベンチマークは、ハードウェアベンダー、IT業界、オリジナル機器メーカー(OEM)、政府機関による使用を意図しています。SPECpower_ssj® 2008の指標「全体ssj_ops/watt」は、SUT(System Under Test)の電力効率を示します。これは、すべてのターゲット負荷に対する全体のスループットssj_opsスコアの合計と、すべてのターゲット負荷に対する消費電力平均値の合計の比率として算出されます。

第4世代AMD EPYCプロセッサーは、電力効率の分野でもリーダーシップを発揮しています。128コアのAMD EPYC 9754プロセッサーを搭載したデュアルソケットシステムは、Intel Xeon Platinum 8592+プロセッサーを搭載したデュアルソケットシステムに対して、約2.25倍のパフォーマンスを実現しました。
raghu_nambiar_16-1715193246792.png

2. SPEC CPU® 2017を用いた汎用計算

SPEC CPU® 2017ベンチマークは、プロセッサ、メモリサブシステム、およびコンパイラを異なるコンピュータシステムでストレステストし、計算集約型ワークロードの比較に役立つ性能測定を行うため、最も人気のある業界標準ベンチマークの1つになっています。SPEC CPU® 2017には、4つのスイートに分類された43のベンチマークが含まれており、本ブログではそのうちの2つ、SPECrate® 2017 IntegerとSPECrate® 2017 Floating Pointを取り上げます。テスト結果の概要は次の通りです:

  • 32コア: 2P 32コアのAMD EPYC 9374Fシステムは、SPECrate® 2017_int_rate(ベース)で2P 32コアのIntel Xeon Scalable 8562Y+システムに対して約1.14倍の性能、SPECrate® 2017_fp_rate(ベース)では約1.06倍の性能を発揮します。
  • 64コア: 2P 64コアのAMD EPYC 9554システムは、SPECrate® 2017_int_rateで2P 64コアのIntel Xeon Scalable 8592+システムに対して1.19倍の性能を発揮、SPECrate® 2017_fp_rateでは同等の性能を示します。
  • トップオブスタック: 2P 96コアの汎用AMD EPYC 9654システムは、SPECrate® 2017 int_rateで2P 64コアのIntel Xeon Scalable 8592+システムに対して約1.60倍の性能、SPECrate® 2017 fp_rateでは約1.19倍の性能を発揮します。
    raghu_nambiar_17-1715193656711.png
    raghu_nambiar_14-1715193213013.png

3. SPECjbb® 2015を用いたサーバーサイドJava

SPECjbb® 2015ベンチマークは、Java®ベースのアプリケーションの性能評価を行うため、ポイントオブセールのリクエスト、オンライン取引、データマイニングタスクを管理するITセットアップをシミュレートします。Javaの普及により、このベンチマークはJava仮想マシン(JVM)ベンダー、ハードウェアメーカー、Javaアプリケーション開発者、研究者、学術界にとって重要なものとなっています。テスト結果の概要は次の通りです:

  • 64コア: デュアルソケット64コアのAMD EPYC 9554システムは、SPECjbb® 2015 MultiJVM-maxJOPSでデュアルソケット64コアのIntel Xeon Scalable 8592+システムと同等の性能を示します。
  • トップオブスタック: デュアルソケット96コアの汎用AMD EPYC 9654システムは、SPECjbb® 2015 MultiJVM-maxJOPSでデュアルソケット64コアのIntel Xeon Scalable 8592+システムに対して1.48倍の性能を発揮します。
    raghu_nambiar_12-1715193161070.png

4. TPC Benchmark™Hを用いた意思決定支援システム

TPC Benchmark™ H(TPC-H)は、複雑なビジネスインクワイアリーに対処するシステムの性能を、広範なデータセットに対する複雑なクエリを実行することで評価するベンチマークです。このベンチマークのクエリとデータ操作は、多様な業界に関連しています。

TPC-Hは、システムのクエリ処理効率を測定するTPC-H Composite Query-per-Hour Performance Metric(QphH@Size)を用いて結果を示します。このメトリックは、データベースのサイズ、クエリストリームを処理する計算能力、および同時ユーザーリクエストを管理する際のクエリスループットを考慮します。TPC-Hはまた、システムの価格対性能比も評価し、システムのコストと性能のバランス、そして俗に言う「コストパフォーマンス」を洞察します。

2P 64コアのAMD EPYC 9554システムは、2P 64コアのIntel Xeon Scalable 8592+システムと比較して、TPC-Hの価格性能比で約1.14倍、価格対性能比で約1.22倍の向上を示しています。
raghu_nambiar_11-1715193140235.png

5. SAP SDを用いたビジネスアプリケーション

SAP Sales and Distribution(SAP SD)は、SAP ERP(Enterprise Resource Planning)ソフトウェア内の重要な物流モジュールです。SAP-SD 2-Tierベンチマークは、SAPアプリケーションパフォーマンス標準単位(SAPS)でデータベースの効率を測定することで、ハードウェアの性能を評価します。SAPSは、SAP環境内でのシステム性能を数値化したもので、ハードウェアに依存しない指標です。最近では、96コアの汎用AMD EPYC 9654プロセッサーを搭載した2Pシステムが、64コアのIntel Xeon Platinum 8592+プロセッサーを搭載した2Pシステムに対して、約1.53倍の性能を示しました。詳細については、最近のブログ「4th Gen AMD EPYC™ CPUs Empower Leadership SAP® Sales & Distribution (SAP SD) 2-Tier Performance」をご覧ください。

図6は、4世代にわたる汎用AMD EPYCプロセッサーの「トップオブスタック」プロセッサーSKUによって達成された性能向上を示しています。また、第2世代AMD EPYCプロセッサーとそれ以降の世代が、対応する世代のIntel Xeonプロセッサーと比較して一貫して優れた性能を発揮していることを示しています。
raghu_nambiar_10-1715193123815.png

6. VMmarkを用いたプライベートクラウドインフラ

VMmark® 3ベンチマークスイートは、プライベートクラウド環境下での仮想化サーバーの性能、電力効率、およびスケーラビリティを包括的に評価するよう設計されています。このベンチマークは、個々のサーバーの能力を評価するだけでなく、異なる仮想化プラットフォーム間の比較も可能にし、それらの相対的な強みと弱みについての貴重な洞察を提供します。テスト結果の概要は次の通りです:

  • 64コア: 2P 64コアのAMD EPYC 9554システムは、VMmark 3で2P 64コアのIntel Xeon Scalable 8592+システムに対して約1.29倍の性能を発揮します。
  • トップオブスタック: 2P 96コアの汎用AMD EPYC 9654システムは、VMmark 3で2P 64コアのIntel Xeon Scalable 8592+システムに対して約1.60倍の性能を発揮します。
    raghu_nambiar_9-1715193102136.png

7. 高性能コンピューティング(HPC)

HPCは、気候予測や輸送・インフラの安全性向上など、現代生活のほぼすべての側面に貢献しています。HPCは、製品の材料使用の最適化や設計の合理化、開発コストの削減により手頃な価格を実現し、開発期間を短縮することができます。また、長時間かかる物理的なテストを省略し、迅速な仮想プロトタイピングを通じて市場投入までの時間を短縮します。

HPCワークロードの性能向上に対する需要は増加しています。性能が向上することで、より迅速なシミュレーションが可能となり、製品開発サイクルが短縮され、より広範なシナリオのテストやモデルの微調整が行えるようになります。最終的には、前世代よりも効果的で効率的な製品の開発につながります。ここでは、第4世代AMD EPYCプロセッサーがHPC性能のリーダーシップを発揮する仕組みを見てみましょう。

 

7.1 計算流体力学(CFD)

計算流体力学(CFD)は、ボートの船体周りの水の流れや車両や航空機の周りの空気の流れなど、流体の挙動をシミュレートし、分析するために数値解析を用います。その応用範囲は、産業処理や消費者製品まで多岐にわたります。CFDタスクは計算負荷が高く、特にメモリ帯域幅が制約となることが多くあります。

  • Altair® AcuSolve®: Altair® AcuSolve®は、従来のCFDアプリケーションに関連する困難を避けながら、完全な流れ、熱伝達、乱流、非ニュートン材料の解析能力を適用して設計を探るための確かな資産です。2P 32コアのAMD EPYC 9374Fシステムは、AcuSolveのacus-inテストで2P 32コアのIntel Xeon Scalable 8562Y+システムの約1.46倍の性能を発揮しました。
    raghu_nambiar_8-1715193084480.png
  • Ansys® CFX®: Ansys® CFX®は、広範なCFDおよびマルチフィジックスアプリケーションにおいて、高性能で信頼性が高く、迅速なソリューションを提供するCFDソフトウェアツールです。32コアのAMD EPYC 9374Fシステムは、CFXの選択されたテストで、32コアのIntel Xeon Scalable 8562Y+システムの約1.48倍の複合平均性能を示しました。
    raghu_nambiar_7-1715193068515.png
  • Ansys® Fluent®: Ansys® Fluent®は、高度な物理モデリング機能と業界をリードする精度を提供する流体シミュレーションアプリケーションです。2P 32コアのAMD EPYC 9374Fシステムは、Fluentの選択されたテストで2P 32コアのIntel Xeon Scalable 8562Y+システムの約1.25倍の複合平均性能を示しました。
    raghu_nambiar_6-1715193041079.png
  • OpenFOAM®: OpenFOAM®は、商用および学術機関に利用されている無料のオープンソースCFDソフトウェアです。OpenFOAM内の選択されたテストを実行した結果、2P 64コアのAMD EPYC 9554システムは、2P 64コアのIntel Xeon Scalable 8592+システムに対して約1.14倍の複合平均性能を示し、トップオブスタックの汎用2P 96コアAMD EPYC 9654システムは、同じ64コアのIntel Scalable 8592+システムに対して約1.22倍の複合平均性能を示しました。
    raghu_nambiar_5-1715193018964.png

7.2 明示的有限要素解析(FEA)

明示的有限要素解析(FEA)は、衝撃、爆発、衝突などの動的状況下での構造や材料の挙動を評価する数値シミュレーション手法です。自動車業界では、衝突時の車両の挙動を予測し、乗員の安全性を評価するためにFEAが使用されます。携帯電話メーカーは、FEAを使用して落下試験をシミュレートし、製品の耐久性を確認します。シミュレーションを使用し仮想的にテストすることで、メーカーは物理的なプロトタイプに依存する必要がなくなり、設計にかかるコストと時間を削減できます。

これらのシミュレーションでは、車や携帯電話といったデバイスの複雑なデジタルモデルが使用されます。これらのモデルは、衝撃などの動的なイベントをシミュレートし、時間の経過に伴う微分方程式を解きます。モデルの異なる部分が相互作用し、変形や故障の可能性があるかどうかを検討します。これらの計算には、膨大な計算能力とメモリ帯域幅が必要です。また、モデルの相互接続性により、異なるコンピュートノード間での情報交換が重要となります。

  • Ansys® LS-DYNA®: Ansys® LS-DYNA®は、広範な産業で使用される明示的シミュレーションプログラムです。自動車、航空宇宙、建設、軍事、製造、およびバイオエンジニアリング産業における複雑な短期間イベントをシミュレートすることができます。2P 32コアのAMD EPYC 9374Fシステムは、LS-DYNAの選択されたテストで2P 32コアのIntel Xeon Scalable 8562Y+システムの約1.50倍の複合平均性能を示しました。
    raghu_nambiar_4-1715193001196.png
  • Altair® Radioss™: Altair® Radioss™は、衝突やクラッシュ条件下での構造解析を行います。そのベンチマークは、典型的な使用を表すベンチマーク問題のセットを使用してハードウェア性能データを提供します。2P 32コアのAMD EPYC 9374Fシステムは、Radiossの選択されたテストで2P 32コアのIntel Xeon Scalable 8562Y+システムの約1.25倍の複合平均性能を示しました。
    raghu_nambiar_3-1715192981462.png

7.3 分子動力学

分子動力学は、原子や分子の運動や挙動を解析する計算手法です。これにより、物質の挙動、タンパク質の折りたたみ、化学反応など、さまざまな現象を探ることができ、分子システムに関する貴重な洞察が得られます。GROMACSは、数百から数百万の粒子を持つシステムのニュートン運動方程式をシミュレートするモジュラー動力学アプリケーションです。第4世代AMD EPYCプロセッサーは、ライバルのデータセンタープロセッサーと比較して優れた性能を発揮し、2P 64コアのAMD EPYC 9554システムは、2P 64コアのIntel Xeon Scalable 8592+システムに対して約1.24倍の複合平均性能を示しました。さらに、トップオブスタックの2P 96コアAMD EPYC 9654システムは、同じIntelプロセッサーシステムを使用して選択されたテストで約1.63倍の複合平均性能を示しました。
raghu_nambiar_3-1715192981462.png

7.4 量子化学

量子化学は、分子の構造、エネルギー、および反応性などの分子特性を探ることで、結合や反応の理解を深めます。CP2Kは、さまざまな原子レベルのシステムをシミュレートする量子化学および固体物理学ツールです。H2O-dft-lsテストでは、2P 64コアのAMD EPYC 9554システムは、2P 64コアのIntel Xeon Scalable 8592+システムに対して約1.27倍の性能を持ち、トップオブスタックの2P 96コアAMD EPYC 9654は、同じIntelプロセッサーシステムに対して約1.62倍の性能を示しました。
raghu_nambiar_1-1715192939436.png

7.5 気象予測

気象予測は、私たちの日常生活に欠かせないものです。National Center for Atmospheric Research(NCAR)によって開発および維持されているWeather Research & Forecasting®(WRF®)は、160か国48,000人以上の登録ユーザーを誇ります。この柔軟で計算効率の高いプラットフォームは、メートルから数千キロメートルに至るまで、さまざまなスケールでの運用予測を可能にします。conus2.5kmテストでは、2P 64コアのAMD EPYC 9554システムは、2P 64コアのIntel Xeon Scalable 8592+システムに対して約1.30倍の平均性能を示し、トップオブラインの2P 96コアAMD EPYC 9654システムは、同じIntelシステムに対して約1.50倍の平均性能を示しました。
raghu_nambiar_0-1715192830181.png

8. 結論

このブログに掲載されている分析は、第4世代AMD EPYCプロセッサーが主要なワークロードにおいて第5世代Intel Xeonプロセッサーを凌駕していることを示しています。上記の比較は、さまざまな業界における重要なタスクにおいて、第4世代AMD EPYCプロセッサーが高い性能と信頼性を持っていることを強調しています。第4世代AMD EPYCプロセッサーは、仮想化環境のパワーから、分子動力学や量子化学における複雑なシミュレーションに至るまで、一貫して優れた結果を提供します。AMD EPYCプロセッサーは、すべての主要なオペレーティングシステム、ハイパーバイザー、および主要なクラウドサービスプロバイダーによってサポートされており、ユーザーは、BIOSやOSのチューニングを含むさまざまなワークロードに対して最適なパフォーマンスを実現するためのリソースをAMD Documentation Hubを通じて活用できます。

一覧に戻る