TOP500/GREEN500で2冠を達成－スパコンランキングを席巻するAMD EPYC™とはどのようなサーバー向けプロセッサなのか

2022-06-14更新

2022年5月31日に発表されたスーパーコンピューターの性能ランキング「TOP500」（リンク先は英語）、電力効率ランキング「GREEN500」（リンク先は英語）の首位は Frontier だった(GREEN500はFrontierの128ノード構成時のもの)。そのCPUには AMD EPYC™ を採用している。ほかにもTOP500の上位10システムのうち5システム、GREEN500の上位10システムではなんと8システムが EPYC を搭載しているという状況だ。

現在、スーパーコンピューター分野を席巻する EPYC とはどのようなCPUなのだろうか。日本AMD コマーシャル営業本部セールスエンジニアリング担当マネージャーである関根正人氏に話をうかがった。

EPYC は登場時から業界最多の32コア

EPYC の第1世代製品(コードネーム：Naples)をリリースしたのは2017年になります。コンシューマー向けとして同年2月にリリースした AMD Ryzen™ と同じ「 Zen 」アーキテクチャを採用しつつ、サーバー向けにコア数を増強しています。当時、ライバルはまだ16～20コア止まりだった時、業界最多の最大32コアで登場した EPYC は高い評価を得ました。

2019年にはアーキテクチャを Zen 2 へと進化させた第2世代 EPYC (コードネーム：Rome)をリリースしました。当時のライバルの倍以上のコア数ある64コアを実現したものです。2021年には Zen 3 アーキテクチャを採用した第3世代 EPYC (コードネーム：Milan)をリリースし、2022年、第3世代をベースに3D V-Cacheを搭載したMilan-Xをリリースしました。

ここまで業界最多コアをリードしてきたことも大切なことですが、ほかにも重要かつ革新的な要素がいくつかあります。

EPYC がコア数競争でリードできる理由はパッケージング技術

EPYC で重要なのがまずパッケージング技術です。AMDでは2015年、GPU上に広帯域のHBMメモリを統合した2.5D HBMを皮切りに、MCM(マルチチップモジュール)、チップレットと進化させてきました。

まず、モノリシックダイ(⇔マルチダイ)で32コアを実現しようとなるとダイサイズが大きくなり、歩留まりが大きな課題になります。歩留まりが悪ければコスト増に繋がることはもちろん、ニーズに対してタイムリーに製品を提供することも難しくなります。

モノリシックダイと比べてマルチダイは歩留まりがよい（画像はHot Chips 2021スライドより抜粋）

EPYC のCPUダイは8コア単位です。小さなダイなので歩留まりがよく、廃棄が少ないことでコストも抑えられます。第1世代 EPYC ではCPUダイを4つ(マルチチップ)パッケージングしています。2019年にリリースした第2世代 EPYC では、I/O部分を別ダイとしたチップレットを採用し、同じ面積内にCPUダイを8つ、最大64コアを実現しました。

Milan-Xに採用された3D V-Cacheとは

Milan-Xは、第3世代Milanとソケット互換で追加SKUという意味合いの製品です。型番でも EPYC 7xx3X と、末尾に「X」が付くものがMilan-Xと判別できるようになっています。

Milan-Xの特徴はL3キャッシュの増量です。具体的にはCPUダイあたり32MBから96MBへ、CPUダイ8基では768MBという巨大なL3キャッシュを実現しました。3D V-Cacheは、CPUダイの上にL3キャッシュを積層することでダイ面積やパッケージサイズはそのまま、単位面積あたりのトランジスタ数を飛躍的に向上させたものです。3Dチップレットとも呼んでいます。

EPYC 7003 (Milan)は汎用計算、 EPYC 7003X (Milan-X)はキャッシュ性能に影響を受けやすいアプリケーション向け

MCM、チップレットに続くのがMilan-Xで採用した3Dチップレット（画像はHot Chips 2021スライドより抜粋）

このようなシリコンを積層していく技術は簡単なものではありません。シリコンの積層技術にはC4やMicroBump3Dといったものがありますが、AMDが採用しているのはTSVです。TSVは信号数でC4やMicroBump3Dよりも多く2TB/sという帯域を実現でき、かつ低消費電力も実現しています。

C4、MicroBump3D、TSVの違い。TSVにより角層の信号線を増やし広帯域を実現するとともに電力消費も抑えられている（画像はHot Chips 2021スライドより抜粋）

とはいえ発熱問題はシビアになります。積層する場所は熱密度が低いところを選ぶ必要がありました。比較的熱密度が低いのが本来のL3キャッシュ部分で、Milan-Xではこの上に積層しています。一方、CPUコア部分には熱伝導を行なうストラクチャーシリコンを加えてダイの高さを揃えています。また、Milanと完全ソケット互換を保つためにシリコンレベルで削って高さを合わせています。

（画像はHot Chips 2021スライドより抜粋）

Milan-XとMilanそれぞれ有効なアプリケーションがある

Milan-XがMilanの追加SKUと紹介したように、Milan-Xが有効なアプリケーション、従来のMilanが有効なアプリケーションというものがあり、棲み分けされます。

Milan-Xが効くのはL3キャッシュが効くアプリケーションです。Milan-Xの大容量キャッシュなら、これまでのL3には大きすぎたデータも収まることになり、キャッシュヒット率を高めることにつながります。たとえばOpenFORMベンチマークのシングルノード性能比較では、Milan-X( EPYC 7773X 、64コア)がMilan( EPYC 7763 、64コア)に対して最大33％ほど向上しています。

競合との比較もご紹介しておくと、同じ32コア×2基のシングルノードで、Ansys Fluentを用いたベンチマークでは最大88％高いスコアを記録しています。

同コア、2ソケットのシングルノード比較では最大88％、ソケットあたりの比較では最大96％の性能向上

そして、Milan-Xには16/24/32/64コアのラインナップがあり、すべて768MBのL3キャッシュを搭載しています。コア数の少ないモデルであるほど、1コアあたり利用可能なL3キャッシュ容量がより多くなります。64コアモデルの EPYC 7773X なら8コアで96MBを利用できますが、16コアモデルの EPYC 7373X なら2コアで96MBを利用できることになります。

Milan-Xはコア数別に4つのラインナップ。すべてが768MBのL3キャッシュを搭載している

一方、MilanはMilan-Xよりも比較的高クロックのモデルが多く、たとえばCPU負荷が高くてもデータの再利用率が少ないアプリケーションなどはMilanのほうが適しています。L3キャッシュのミス率がすでに低く、クロックに依存するアプリケーションをお使いならMilanをお選びいただくのが有効です。

コア数に加えL3キャッシュやクロックなど、第3世代EPYCの豊富なラインナップはお使いのアプリケーションに最適なモデルをお選びいただけます。

用途に応じて最適コア数は変わってくる

EDAや半導体設計ツール分野ではコアライセンス形式のものが多い用途では、コア数を抑えつつパフォーマンスを高めることができる16コアモデルが最適です。一方、計算流体力学、航空宇宙、物理シミュレーションなどはコアライセンス形式が多いもののスレッド数が重要なため24コアモデルが適しています。有限要素解析や構造解析などは高度にスレッド化されたものが多くデータサイズも大きいため、32コア、64コアモデルが適しています。

Milan-Xが得意とする4つの分野と最適な EPYC モデルの例

EPYC は常にロードマップ通りに投入されている

ここで EPYC のとても重要なポイントですが、2017年に第1世代を投入して以降、現在の第3世代までロードマップどおりに投入していることが挙げられます。オンタイムで遅れはいありません。AMDは顧客の皆さまのスケジュールを狂わせるようなことはありません。そして2022年後半には第4世代も予定どおり量産に入る予定です。現行7nmプロセスよりも微細化を進めた5nmプロセスを採用し、コアアーキテクチャは Zen 4 へと進化します。そしてもう一つ、コア数を増強した Zen 4c も登場予定です。

また、ただ投入するのではなく、 EPYC のCPUコアアーキテクチャである Zen は、1世代ごとにIPCを大幅に向上させてきました。第2世代から現在の第3世代では20％に迫る向上です。たとえば、ライバルが22台のサーバーを必要とする計算を、 EPYC なら18台で実現することが可能です。サーバーの設置スペースや電力効サーバーYCはTCO削減に貢献します。

同じ処理を行なう際はノード数を少なくコストも抑えられる

こうしたメリットを評価いただき、HPCから好評を得た EPYC はウェブテック、クラウドなどでも広く採用されるようになりました。今後、5Gやその先、スループットを求める分野に向けて製品をリリースしていきます。

日本国内でも EPYC の採用例は増えています。国立機関で公表可能なものとしては、沖縄科学技術員大学、国立遺伝学研究所、東京大学物性研究所、東北大学、国立研究開発法人海洋研究開発機構などのスーパーコンピューターが EPYC を搭載しています。また、オンプレミスでサーバーを運用し電力効率が非常に重要となるウェブテック関連、スループットが要求されるコンテンツデリバリーネットワーク関連は、とくに EPYC の採用例が多い分野になります。

第1世代からここまで EPYC はロードマップのスケジュールどおりに製品を投入してきました。ただ投入するのではなく、今後も世代を重ねるごとにIPCを高め、より新しいパッケージング技術を用い、TSMC最先端プロセスによって電力効率を高め、ライバルを1歩も2歩もリードする性能を実現していきます。

一覧に戻る

TOP500/GREEN500で2冠を達成－スパコンランキングを席巻するAMD EPYC™とはどのようなサーバー向けプロセッサなのか

EPYC は登場時から業界最多の32コア

EPYC がコア数競争でリードできる理由はパッケージング技術

Milan-Xに採用された3D V-Cacheとは

Milan-XとMilanそれぞれ有効なアプリケーションがある

用途に応じて最適コア数は変わってくる

EPYC は常にロードマップ通りに投入されている

ハイブリッドワーク時代に役立つNECのモバイルPC

10万円台から購入できる高コスパモバイルAMD Ryzen™ 5000シリーズ搭載「ThinkPad T14 Gen2」を検証

TOP500/GREEN500で2冠を達成 － スパコンランキングを席巻するAMD EPYC™とはどのようなサーバー向けプロセッサなのか

EPYC は登場時から業界最多の32コア

EPYC がコア数競争でリードできる理由はパッケージング技術

Milan-Xに採用された3D V-Cacheとは

Milan-XとMilanそれぞれ有効なアプリケーションがある

用途に応じて最適コア数は変わってくる

EPYC は常にロードマップ通りに投入されている

関連記事

AMD Instinct MI350シリーズとその先：AIとHPCの未来を加速する

RAGを活用した迅速なAI導入

AMD Ryzen™ AI 300シリーズでAFMF 2と可変グラフィックスメモリを活用したゲーミングパフォーマンスの最大化

AMD Ryzen™ AIとRadeon™ GPUによって加速されたドキュメント チャットで、強力なAIアシスタントを手に入れましょう

世界有数のデータベースがAMD EPYCプロセッサでより優れたパフォーマンスを発揮

AMD、産業用AI対応のNPU搭載 Ryzen™ Embedded 8000シリーズを発表

AMD Ryzen™およびRyzen PRO™プロセッサー 効率計算機でシステムの電力効率を探る

第4世代AMD EPYC™プロセッサーが最新の第5世代Intel® Xeon®プロセッサーを凌駕する

TOP500/GREEN500で2冠を達成－スパコンランキングを席巻するAMD EPYC™とはどのようなサーバー向けプロセッサなのか

AMD Ryzen™ AIとRadeon™ GPUによって加速されたドキュメントチャットで、強力なAIアシスタントを手に入れましょう

AMD Ryzen™およびRyzen PRO™プロセッサー効率計算機でシステムの電力効率を探る