「Bergamo」第4世代AMD EPYC™ 97×4プロセッサー: クラウド・ネイティブ・ワークロード向け

AMD EPYC™ プロセッサー

2023-09-20更新

  • twitter
  • facebook
  • line

6月、Datacenter and AI Technology Premierにおいて、第4世代 AMD EPYC™ プロセッサー・ファミリーに2つのプロセッサー・モデルが追加発表されました。この機会に、ソフトウェア・エコシステムの準備状況についての最新情報を提供し、AMD EPYC™ 97×4プロセッサーの性能実証ポイントのいくつかを紹介できることをうれしく思います。(※情報は2023年6月当時のものです)

AMDは革新を続け、今日のモダンなデータセンターの特定のセグメントに最適な製品を生み出しています。 AMD EPYC™ 97×4 プロセッサーは、クラウド・ネイティブ・コンピューティングに特化した業界初のx86プロセッサーです。これらのプロセッサーは、5nmプロセス・テクノロジー上に構築された最大128個の「Zen 4」コアを搭載し、クラウド・ネイティブ・ワークロード向けに業界をリードするパフォーマンス、密度、エネルギー効率を実現します。また、最大4800 GHzのメモリ速度をサポートする12チャネルのDDR5、PCIe Gen4の2倍の転送速度を実現する最大128(1P)または160(2P)のPCIe® Gen5レーン、第2世代Infinity Fabric™ の2倍のデータ転送速度を実現する第3世代Infinity Fabric™、使用中のデータを保護するAMD Infinity Guardテクノロジー、現行の第4世代 AMD EPYC™ プラットフォームとのソケット互換性など、すべての第4世代 AMD EPYC™ プロセッサーに搭載されている最先端のテクノロジーも搭載しています。

AMD EPYC™ 97×4 プロセッサーは、標準的な AMD EPYC™ 9004 シリーズ・プロセッサーによって確立されたリーダーシップ・パフォーマンスをさらに拡張します。 AMD EPYC™ 9004 シリーズ・プロセッサーが獲得した300を超える世界記録は、AMDが業界をリードするエネルギー効率と最適な総所有コスト(TCO)を実現しながら、パフォーマンス・リーダーシップを絶え間なく追求していることを物語っています。業界はこうした努力に応えてきました: AMD EPYC™ プロセッサーに搭載されている革新的な機能とテクノロジーを活用したフルスタック・ソリューションとパートナーシップの豊かで成長するエコシステムは、お客様の現在および将来のワークロード・ニーズに対する価値提供までの時間を短縮します。

当社は、当社のエンジニアと協力し、幅広いデータセンター・ソリューションを提供し続けているパートナー各社の広範なエコシステムに感謝しています:
Alibaba Cloud, Altair, AlmaLinux, Amazon Web Services, Anjuna, Ansys, ASRock, Asus, Atos, BEAMR, Broadcom, Cadence, Canonical, Casa Systems, Cisco, Citrix, Cloudera, Couchbase, Dassault Systèmes, Datastax, Dell, Elastic, Equinix, ESI, Excelero, Foxconn, FreeBSD, Gigabyte, Google Cloud, HBC, HPE, IBM Cloud, Inventec, JMA, Juniper, Kioxia, Lenovo, MariaDB, Mavenir, SingleStore, Micron, Microsoft, Mitac, Neural Magic, MongoDB, MSI, MySQL, NetScout, Nokia, Nutanix, Oracle, PGS Software, QCT, Quobyte, Radisys, Red Hat, RedisLabs, Robin, Rocky Linux, Samsung, Shearwater, Siemens Digital Industries Software, SK Hynix, SLB, Splunk, StorMagic, Supermicro, SUSE, Synopsis, Tencent Cloud, TigerGraph, Transwarp, Tyan, Velocix, Vertica, WEKA, VMware, Western Digital, Wiwynn, Wistron そしてその他のパートナーの各社です。

ここでは、 AMD EPYC™ 97×4 プロセッサーの裏側と、それが提供する市場、そして主な性能のハイライトを紹介します。

妥協のないクラウド・ネイティブ・コンピューティング

新しい第4世代 AMD EPYC™ 97×4 プロセッサーは、妥協のないコンピューティング・パフォーマンス、密度、エネルギー効率を提供し、拡大するクラウド・ネイティブ環境のニーズに応えます。クラウド・ネイティブの開発手法は、さまざまな業界や業種の新世代のワークロード向けに効率的でスケーラブルなサービスを迅速に提供するための、開発者にとって最適化されたアプローチとして台頭してきています。クラウド環境では、ソフトウェア・スタックを頻繁かつ迅速に変更する必要があるため、効率的でスケーラブルなアーキテクチャに対する需要が高まっています。 AMD EPYC™ 97×4 プロセッサーを搭載したシステムは、現在および将来のクラウド・ネイティブ・サービスを最適なTCOで実行するための堅牢性、拡張性、エネルギー効率、スペース効率の高い環境を提供することで、このニーズに対応しています。 AMD EPYC™ 97×4 プロセッサーは、最大128個のSMT対応(同時マルチスレッディング)プロセッサー・コアを搭載し、新たなレベルのパフォーマンス、エネルギー効率、互換性を実現します。

AMD EPYC™ 97×4 プロセッサーが、クラウド・ネイティブ・アプリケーションにおいて、Ampere® Altra ® Max M128-30プロセッサーとIntel® Xeon ® Platinum 8490Hプロセッサーを凌ぐ性能を発揮することをお伝えできることを嬉しく思います。以下は、 AMD EPYC™ 97×4 プロセッサーの優れたパフォーマンスを示す、複数のクラウド・ネイティブ・ワークロードで実施したパフォーマンス・テストの結果です。

・リレーショナルデータベース管理システム(RDBMS): MySQL™ は、世界で最も普及しているオープンソースのデータベース管理システムです。信頼性が高く、使いやすい高性能リレーショナルデータベース管理システムとして評価されています。MySQLの導入と監視を容易にする多くのフレームワークとツールにより、MySQLはクラウド導入に適した堅牢で安全なデータベースとして登場しました。

AMDのエンジニアは、 AMD EPYC™ 9754 プロセッサーと競合システムとで、一般的なTPC Benchmark™ Cから派生したワークロードを実行しました。テスト方法には、Ubuntu® v22.04とMySQL™ v8.0.33で構成されたテスト対象システムが含まれます。HammerDB v4.4は、ワークロードの構築と生成のために別のクライアントシステム上で実行されました。テスト対象のシステム上では、VMごとに32のvCPUと128GiBのメモリを搭載した複数のVMが実行されました。各 VM は、1000 倉庫分作成されたスキーマを持つ MySQL データベースを 1 つ実行しています。すべてのVMは、VMごとに個別のHammerDBクライアント・インスタンスによって同時にロードされました。作業負荷はそれぞれ10分間実行され、相対的なパフォーマンスを比較するために、プラットフォームごとに5回の実行にわたってNOPM(New Orders Per Minute)の中央値の集計を記録しています。

2プロセッサーの AMD EPYC™ 9754 システムは、2プロセッサーのAmpere Altra Max M128-30システムと2プロセッサーのIntel Xeon Platinum 8490Hシステムの両方を上回りました。図1をご覧ください。[1]

図 1: MySQL トランザクション処理のパフォーマンス

・エンタープライズJava: Java ®は、企業やクラウドを横断する普遍的な言語となっています。クラウド環境でJavaを実行することで、CやC++などの従来の言語と比較して、開発と展開が簡素化されます。SPECjbb® 2015ベンチマークは、サーバーサイドJavaベース・アプリケーションの公正な性能測定を可能にする一般的な基準です。SPECjbb® 2015は、POS要求、オンライン購入、データマイニング業務が混在するITインフラを持つ企業をシミュレートしています。過去 20 年間、業界全体で Java が急速に採用されたため、このベンチマークは、Java 仮想マシン(JVM)ベンダー、ハード ウェア開発者、Java アプリケーション開発者、研究者、アカデミック・コミュニティのメンバーなど、あらゆる対象者に関連しています。

2プロセッサーの AMD EPYC™ 9754 システムは、2プロセッサーのAmpere Altra Max M128-30システムおよび2プロセッサーのIntel Xeon Platinum 8490Hシステムを上回っています。図2をご覧ください。[1]

図2:サーバーサイドJavaのパフォーマンス

・NGNIX®: 今日では、ウェブサイトを作成し、完全なウェブサービス・スタックをクラウドにデプロイするのが一般的です。NGNIX®は、リバースプロキシ、ロードバランサー、メールプロキシ、HTTPキャッシュとしても使用できる一般的なWebサーバーです。AMDは、WRKウェブ(http)クライアントと組み合わせた高性能ウェブサーバーとして、NGINXのスループットを1秒あたりのリクエスト数でテストしました。

テスト方法には、Ubuntu v22.04、NGINX v1.18.0をサーバーとして、WRK v4.2.0をウェブクライアントとして設定したテスト対象システムが含まれます。テスト対象のシステム上では、複数のサーバーとクライアントのインスタンスが実行され、インスタンスあたり16個のvCPUがウェブサーバーとクライアントで共有されました。ネットワーク遅延を最小化するため、サーバーとクライアントは同じシステム上で実行されるようにしています。各 WRK クライアントは、それぞれの NGINX サーバーから小さな静的バイナリファイルをフェッチする 650 の接続を作成しました。作業負荷テストはそれぞれ 90 秒間実行され、相対的なパフォーマンスを比較するために、プラットフォームごとに 3 回の実行にわたって、1 秒あたりのリクエスト数(rps)の中央値の合計を記録しています。

2プロセッサーの AMD EPYC™ 9754 システムは、2プロセッサーのAmpere Altra Max M128-30システムおよび2プロセッサーのIntel Xeon Platinum 8490Hシステムを上回りました。図3をご覧ください。[1]

図 3: NGINX ウェブサーバーのパフォーマンス

・Redis™: Redis™は、最適な耐久性を備えた分散型のインメモリ・キーバリュー・データベース、キャッシュ、メッセージ・ブローカーとして使用されるインメモリ・データ構造ストアです。Redisはクラウドに適しており、ストリーミング、マイクロサービス、データ分析などの標準的な機能をすべて利用できるため、テナント内で超生産性を実現できます。Redisは、文字列、リスト、マップ、セット、ソートされたセット、HyperLogLog、ビットマップ、ストリーム、空間インデックスなど、さまざまな種類の抽象データ構造をサポートしています。Redisはインメモリデータセットで動作し、最高のパフォーマンスを実現するシステムです。

テスト方法には、Ubuntu v22.04 OS、サーバーとしてRedis v7.0.11、クライアントとしてredis-benchmark v7.0.11で構成されたテスト対象システムが含まれました。複数のサーバーとクライアントのインスタンスがテスト対象のシステム上で実行され、インスタンスあたり8 vCPUがサーバーとクライアントで共有されています。ネットワークレイテンシを最小化するため、サーバーとクライアントは同じシステム上で実行されました。各 WRK クライアントは、それぞれの Redis サーバーから 1000 バイトのキーサイズを設定/取得するために 512 のコネクションを作成しています。ワークロードテストはそれぞれ10Mリクエストで実行され、相対的なパフォーマンスを比較するために、プラットフォームごとに3回の実行で1秒あたりのリクエスト数(rps)の中央値の合計を記録しました。

2 プロセッサーの AMD EPYC™ 9754 システムは、2 プロセッサーの Ampere Altra Max M128-30 システムと 2 プロセッサーの Intel Xeon Platinum 8490H システムを上回りました。図 4.1 および図 4.2 をご覧ください。[1]

図4.1: RedisベンチのGETパフォーマンス

図4.2: RedisベンチのSETパフォーマンス

・FFmpeg: FFmpegはフリーのオープンソースソフトウェアプロジェクトで、ビデオ、オーディオ、その他のマルチメディアファイルやストリームを扱うライブラリ、コーデック、プログラムのスイートで構成されています。コアとなるFFmpegプログラムは、ビデオやオーディオファイルのコマンドライン処理のために設計されています。エンコード、トランスコード、編集、ビデオスケーリング、ビデオポストプロダクション、および標準準拠のために広く使用されています。この性能評価では、VP9コーデックを使用して、生の4K解像度の入力ファイルをMKV出力ファイルにトランスコードしました。

テスト方法には、Ubuntu v22.04とFFmpeg v4.4.2で構成されたテスト対象システムが含まれます。複数のFFmpegインスタンスが、FFmpegインスタンスあたり4 vCPUでテスト対象のシステム上で実行されました。各FFmpegインスタンスは、NVMeドライブ上のrawビデオフォーマットの4K解像度の単一の入力ファイルを、別のNVMeドライブ上のVP9コーデックの出力ファイルにトランスコードしました。各システムで複数のFFmpegジョブを同時に実行し、3回の実行で1時間あたりに処理された総フレームの中央値を使用して、各システムのパフォーマンスを比較しました。

2プロセッサーの AMD EPYC™ 9754 システムは、2プロセッサーのAmpere Altra Max M128-30システムおよび2プロセッサーのIntel Xeon Platinum 8490Hシステムを上回りました。図5をご覧ください。[1]

図5:ビデオのトランスコード・パフォーマンス

・Cassandra®: Apache® Cassandra®データベースは、パフォーマンスを損なうことなくスケーラビリティと継続的な可用性を必要とする場合に最適です。また、Cassandraはマルチテナント環境でのデータ配布を簡素化し、特にクラウドに適しています。クラウド・インフラストラクチャーにおける予測可能なスケーラビリティと実証済みの耐障害性により、ミッション・クリティカルなデータにとって理想的なプラットフォームとなっています。

テスト方法には、Ubuntu v22.04、OpenJDK v11、Apache Cassandra v4.1.2をサーバー・アプリケーションとして、Cassandra-test v4.1.2をクライアントとして構成したテスト対象のシステムが含まれます。複数のサーバー・インスタンスとクライアント・インスタンスが、1インスタンスあたり32 vCPUでテスト対象のシステム上で実行されました。各Cassandraデータベースが起動され、1Mの初期値が追加されました。各クライアントとサーバーのインスタンス・ペアは、書き込み25%、読み取り75%でテストされました。複数のクライアントとサーバーのペアが同時に実行され、5回の実行で1時間当たりに処理された総フレームの中央値を使用して、各システムの集約パフォーマンスが比較されました。

2プロセッサーの AMD EPYC™ 9754 システムは、2プロセッサーのAmpere Altra Max M128-30システムおよび2プロセッサーのIntel Xeon Platinum 8490Hシステムを上回りました。図6をご覧ください。[1]

図6: Cassandraのパフォーマンス

・Memcached™: Memcached™は、呼び出し(データベースまたはAPI)またはレンダリングページの結果から、任意のデータ(文字列、オブジェクト)の小さなチャンクのキー値を保存する、高性能な分散型インメモリ・キャッシング・システムです。Memcachedは、キャッシュされたアイテムを高速に提供することができ、高い負荷に対して簡単にスケーリングでき、費用対効果が高いため、クラウドで非常に人気があります。Memcachedは、データベースのクエリ結果のキャッシュ、セッションのキャッシュ、Webページのキャッシュ、APIのキャッシュ、画像、ファイル、メタデータなどのオブジェクトのキャッシュに多用されています。大規模なデータ・キャッシュが直面する問題を解決するため、シンプルで強力、かつ迅速で容易な開発とデプロイメントを目的として設計されたシステムです。

テスト方法は、Ubuntu v22.04、サーバーとしてMemcached v1.6.14、クライアントとしてmemtier v1.4.0で構成されたテスト対象システムを含んでいます。複数のサーバーとクライアントのインスタンスがテスト対象のシステム上で実行され、インスタンスあたり8個のvCPUがサーバーとクライアントで共有されました。ネットワークレイテンシを最小化するため、サーバーとクライアントは同じシステム上で実行されています。各クライアントは、Memcached_textプロトコルを使用して、それぞれのMemcachedサーバーと10コネクション、8パイプライン、および1:10のセット:ゲットの比率を作成しました。相対的なパフォーマンスを比較するため、プラットフォームごとに3回の実行を行い、1秒あたりのリクエスト数(rps)の中央値を記録しています。

2プロセッサーの AMD EPYC™ 9754 システムは、2プロセッサーのAmpere Altra Max M128-30システムおよび2プロセッサーのIntel Xeon Platinum 8490Hシステムを上回りました。図7をご覧ください。[1]

図 7: Memcached のパフォーマンス

・VMmark® 3: VMmark® 3は、業界をリードするエンタープライズ仮想化統合ベンチマークであり、さまざまなハードウェア・ベンダー・プラットフォーム上でのVMware® vSphere®ハイパーバイザーのパフォーマンスとスケーラビリティを測定します。AMD EPYCプロセッサーを搭載したプラットフォームは、現在、最も競争の激しい3つのカテゴリ(2ノード4ソケットSAN、4ノード8ソケットvSAN、総合リーダーシップ)で性能のリーダーを占めています。VMmark3は、VMware VMmark3のウェブサイト*に掲載されている信頼性が高く正確な論文により、オンプレミスおよびパブリック・クラウドの両方でVMware vSphereを利用するユーザーに人気があります。

AMDは、 EPYC™ 製品ファミリーが実現するVM密度を誇りに思っており、 AMD EPYC™ 9754 の発表も例外ではありません。AMD EPYC 9754は、Intel Xeon Platinum 8490H 2ノードvSphereクラスターと比較して、仮想化統合性能において約89%の向上を実現しています。図8をご覧ください[2]。

図8:VMmark3のパフォーマンス(2ノード、マッチドペア)

・電力効率: データセンターのエネルギー消費は、クラウド・サービス・プロバイダーが直面する最重要課題の1つです。これは、エネルギー・コストがデータセンターの運用コストを押し上げる主要因の1つになっているためです。 AMD EPYC™ 9754 プロセッサーを搭載したプラットフォームは、信頼と実績のあるSPECpower_ssj 2008ベンチマークによる測定で、業界をリードする省電力と世界最高水準のパフォーマンスの両方を実現します。多くの電力効率に関する主張は、アイドル時消費電力や100%負荷レベルといった部分的なデータを使用していますが、SPECpower_ssj2008では、アクティブ・アイドル時消費電力と、10%から始まり20%、30%、そして最終的には100%に達する段階的な負荷レベルの両方を測定し、システム利用率の全スペクトルを使用して消費電力と性能の特性を評価します。

2 プロセッサーの AMD EPYC™ 9754 システムは、spec.org で公表された結果に基づき、SPECpower_ssj2008 において、アイドル時、10%時、20%時、および負荷容量 100%時までのすべての段階で電力効率を実現し、全体として 2 プロセッサーのインテル Xeon 8490H の約 1.97 倍、2 プロセッサーのアンペール Altra Max 128-30 の約 2.73 倍の電力効率を実現しました。図 9 をご覧ください。[3]

図9:さまざまな負荷水準におけるSPECpower_ssj 2008の性能

結論

AMD は、パートナーに報いるよう、全力を尽くしています。当社は、パートナーがサービスを提供するさまざまな市場セグメントや業種の進化に対応する必要性を理解しています。AMDは、ターゲットとするセグメントに特化した製品の革新を続けており、先日発表された AMD EPYC™ 97×4 プロセッサーは、AMDの継続的なコミットメントの新たな証です。

AMDは、お客様の環境に第4世代 AMD EPYC™ プロセッサーを導入する際に、これらの主要なワークロードで最適なパフォーマンスを達成するための最適なCPUチューニング方法に関するガイダンスを提供しています。詳細については、 AMD EPYC™ サーバー・プロセッサーをご覧ください。

2022年11月に発表された第4世代 AMD EPYC™ プロセッサーは、ワークロード全体で最適なTCOを実現する世界最高性能のサーバー・プロセッサーであり、業界をリードするx86のエネルギー効率[4]により持続可能性の目標をサポートし、豊富なソリューションのエコシステム全体でコンフィデンシャル・コンピューティングを実現します。 AMD EPYC™ 97×4 プロセッサーと AMD 3D V-Cache™ テクノロジーを搭載した AMD EPYC™ 9004 プロセッサーの登場により、第4世代 AMD EPYC™ プロセッサーのラインアップは、それぞれクラウド・インフラストラクチャーとメモリ・バウンド・ワークロード向けに最適化された新しいプロセッサー・モデルで拡張されます。

その他の主要なAMDテクノロジーは以下のとおりです:
・AMD Instinct™ アクセラレーターは、科学者が最も差し迫った課題に取り組めるよう、エクサスケールでの発見を後押しするよう設計されています。
・AMD Pensando™ ソリューションは、高度にプログラマブルなソフトウェア定義のクラウド、コンピュート、ネットワーキング、ストレージ、およびセキュリティ機能を、データがどこにあっても提供します。
https://www.amd.com/en/solutions/infrastructure-acceleration
・AMD FPGAとアダプティブSoCは、柔軟性と適応性に優れたFPGA、ハードウェア・アダプティブSoC、アダプティブ・コンピュート・アクセラレーション・プラットフォーム(ACAP)プロセッシング・プラットフォームを提供し、エンドポイントからエッジ、クラウドまで、さまざまなテクノロジーで迅速なイノベーションを実現します。

Raghu Nambiarは、AMDのデータセンター・エコシステム&ソリューション担当コーポレート・バイス・プレジデントである。彼の投稿は彼自身の意見であり、AMDの立場、戦略、意見を代表するものではありません。第三者のサイトへのリンクは便宜上提供しているものであり、明示的に記載されていない限り、AMDはリンク先のサイトのコンテンツについて責任を負わず、いかなる保証も意味するものではありません。

こちらの記事はAMD本社のブログ記事を機械翻訳したものです。詳しくは元記事をご覧ください。

脚注:

  1. Cloud-Native Workloads on AMD EPYC ™ 9754 Processors: https://www.amd.com/system/files/documents/amd-epyc-9754-pb-cloud-native-workloads.pdf
  2. Results as of 6/16/2023 are published at:
  3. Power Efficiency of AMD EPYC ™ 9754 Processors SPECpower_SSJ® 2008: https://www.amd.com/system/files/documents/amd-epyc-9754-pb-spec-power.pdf
  4. Results as of 6/16/2023 are published at: (i) 2P AMD EPYC 9754 (128-core, SMT on) 33,300 SPECpower_ssj2008 overall ssj_ops/watt https://www.spec.org/power_ssj2008/results/res2023q2/power_ssj2008-20230523-01264.html, (ii) 2P Intel® Xeon® Platinum 8490H (60core) 16,902 SPECpower_ssj2008 overall ssj_ops/watt https://www.spec.org/power_ssj2008/results/res2023q2/power_ssj2008-20230507-01251.html, (iii) 2P Ampere Altra Max M128-30,12,195 SPECpower_ssj2008 overall ssj_ops/watt https://www.spec.org/power_ssj2008/results/res2023q2/power_ssj2008-20230522-01258.html
一覧に戻る