クラウド・ネイティブなワークロード向けに最適化された新しい AMD EPYC™ 97X4 プロセッサの紹介

AMD EPYC™ プロセッサー

2023-12-13更新

  • twitter
  • facebook
  • line

今日の厳しい市場でイノベーションを起こし、競争に打ち勝つために、企業はますますクラウド・ネイティブ・アプリケーションを活用するようになっています。しかし、これらは要求が高くスケーラブルなワークロードであり、最大の価値と効率を実現するには最新のプロセッサが必要です。

クラウド・ネイティブ・アプリケーションは、必要な場所でソフトウェアを実行するのに適した高度な分散アーキテクチャで実行されます: パブリック・クラウド、オンプレミスのエンタープライズ・データセンター、エッジ、モノのインターネット(IoT)デバイスなど、必要な場所でソフトウェアを実行するのに適しているのです。この柔軟性は、旧来のモノリシックなソフトウェア構造ではなく、コンテナで実行されるマイクロサービスを使用して構築されたソフトウェアによってもたらされます。

また、クラウド・ネイティブ・アーキテクチャは、アプリケーションの迅速な更新というビジネス要件にも対応しています。継続的インテグレーション/継続的デリバリー(CI/CD)により、アプリケーションのアップデートは、旧世代のモノリシック・ソフトウェアで必要だった数カ月ではなく、数時間でデプロイされます。

ラック密度を最大化して需要の増加に対応

AMD EPYC™ 9754 ベースのシステムにより、インフラ事業者はラック密度とスケーリングを最大化して、ユーザー・セッションの需要増に対応し、新しいサービスを提供することができます。

コア密度は、第4世代 AMD EPYC™ 9754 プロセッサがクラウド・ネイティブ・アプリケーション向けに最適化する上で不可欠です。このプロセッサは、最大128個のSMT対応(同時マルチスレッディング)エネルギー効率に優れたプロセッサー・コアをサポートし、高性能、1Uおよび2Uのワークロード密度、エネルギー効率、X86互換性を実現しています。

コア密度が高いということは、第4世代 AMD EPYC™ 9754 プロセッサによって、クラウド・プロバイダーは、より大きな処理能力を求める顧客の需要にコスト効率よく応えることができるということです。このCPUを搭載したシステムは、スペースに制約のあるデータセンターにも魅力的な価値を提供します。このプロセッサは、1CPUあたり128コア/256スレッドのアーキテクチャを採用しており、1Uシステムで利用可能な最高の仮想中央処理装置(vCPU)密度とスケーラビリティを提供し、SMTを有効にした2ソケット・システムでは、1システム/サーバーUあたり最大512スレッドを提供しています。これは、大規模なユーザーとサービスに対応する極めて高い密度と言えるでしょう。多くの顧客がコンテナをホストする各vCPUに少なくとも1スレッドを割り当てることを好むため、このプロセッサは、他のプロセッサー・オプションよりもシステムおよびラックあたり多くのコンテナをサポートすることができます。 データセンター事業者は、このシステム単位およびラック単位のスケールにより、ITインフラのスプロールを最小限に抑え、低レイテンシーと高いサービス品質(QoS)を維持しながら、高性能コンテナ(vCPU)に対する需要の増大に対応することができます。

AMD EPYC™ プロセッサのコア密度におけるリーダーシップは、その先駆的なチップレット・ベースのアーキテクチャによるところが大きく寄与しています。AMDはチップレットをサポートした最初のプロセッサー・メーカーであり、世代を重ねるごとに実装技術と機能を着実に向上させてきました。2022年11月に発表されたコードネーム「Genoa」の AMD EPYC™ 9004 は、最大96コアに拡張され、業界をリードする汎用サーバー・プロセッサーとなりました。SP5-013D 現在、クラウド・ネイティブ・アプリケーションに特化した AMD EPYC™ 9754 プロセッサは、コア密度とエネルギー効率の新たなレベルに到達しています。

クラウド・プラットフォームは、電力効率を維持しながら処理能力を提供する必要があります。EPYC-028C 例えば、サードパーティによるテストでは、2Pの AMD EPYC™ 9754 システムは、2PのAmpere® Altra® Maxシステムと比較して、ウェブ・サービング・アプリケーションで88%少ないジュールを使用して、1秒あたり約6.8倍のレコード量を提供しました。 SP5-141 この同じテストでは、2P AMD EPYC™ 9754 システムが、Apache Cassandra®などのSQLクラウドデータ提供ワークロードを、2P Ampere Altra Maxシステムよりも~86%少ないジュールで、~2倍のop/秒書き込みでスケーリングすることが示されました。

AMD EPYC™ 9004 との互換性を実現する広範なx86標準化

さらに、 AMD EPYC™ 9754 プロセッサは幅広いx86互換性を提供します。このプロセッサは、先に発売された AMD EPYC™ 9004 プロセッサー・ファミリーの設計とソケット互換性があるため、システム・メーカーは新しいCPUを搭載したソリューションを迅速かつ容易に開発することができます。さらに、 AMD EPYC™ 9754 プロセッサは、CXLTM(Compute Express Link)などの重要な新興データセンター・アーキテクチャをサポートしており、メモリ容量と帯域幅を追加するためのメモリ階層化などの新たな機能を実現します。このような拡張性と新しいコンポーザブル・システム・モデルへの適応性は、急速に進化するクラウド・ネイティブ・データセンターのニーズに対応するために不可欠な柔軟性と将来性を確保するために不可欠です。

このプロセッサのx86互換性とエコシステムは、 AMD EPYC™ 9754 プロセッサを搭載したシステムで、現在および従来のx86ソフトウェアやサービス、最新のクラウド・ネイティブ・アプリケーションの多くを容易に実行できることを意味します。顧客は、VMware®などの高密度なエンタープライズクラスの管理インフラに加えて、新しいコンテナDevOpsモデルとツールを採用することができます。ARM®アーキテクチャは現在、このような幅広い機能を完全にサポートしているわけではありません。4

AMD EPYC™ 9754 プロセッサは、ハイパースケールクラウドプロバイダに価値を提供します。 AMD EPYC™ 9754 プロセッサは、ハイパースケールクラウドプロバイダに価値をもたらすだけでなく、より小規模で専門性の高いクラウド・プロバイダーもそのメリットを享受することができます。

AMD EPYC™ 9754 プロセッサがビジネスアプリケーションにもたらす効果について、詳しくはこちらをご覧ください。

こちらの記事はAMD本社のブログ記事を機械翻訳したものです。詳しくは元記事をご覧ください。

脚注:
SP5-013D: SPECrate®2017_int_baseの比較は、www.spec.org(2023/06/2現在)の公表スコアに基づく。公表されている2P AMD EPYC 9654(1800 SPECrate®2017_int_base、総TDP W 720、総1Ku 23,610ドル、総コア数192、Perf/W 2.500、Perf/CPU$ 0.076、http://spec.org/cpu2017/results/res2023q2/cpu2017-20230424-36017.html)の比較は、他のすべての2P競合プロセッサを上回り、1. 公開されている2P Intel Xeon Platinum 8490H(1000 SPECrate®2017_int_base、700 Total TDP W、34,000ドルの総1Ku、120の総コア、1.429 Perf/W、0.029 Perf/CPU$、http://spec.org/cpu2017/results/res2023q1/cpu2017-20230310-34562.html)の1.80倍の性能[1.75倍の性能/W][2.59倍の性能/CPU$]です。公表されている2P AMD EPYC 7763(861 SPECrate®2017_int_base、TDP合計560 W、1Ku合計15,780ドル、コア数128、Perf/W 1.538、Perf/CPU$ 0.055、http://spec.org/cpu2017/results/res2021q4/cpu2017-20211121-30148.html)は、参考のため、性能0.86倍[性能/W 1.08倍][性能/CPU$ 1.86倍]で表示されています。AMD 1Kuの価格およびIntel ARK.intel.comの仕様と価格は6/1/23現在。SPEC®、SPEC CPU®およびSPECrate®は、Standard Performance Evaluation Corporationの登録商標である。詳細はwww.spec.org。
EPYC-028C: SPECpower_ssj® 2008、SPECrate®2017_int_energy_base、および SPECrate®2017_fp_energy_base は、11/10/22 時点で SPEC のウェブサイトに公表されている結果に基づく。VMmark® server power-performance / server and storage power-performance(PPKW)https://www.vmware.com/products/vmmark/results3x.1.html?sort=score。SPECpower_ssj®2008の公表結果のうち、総合効率が最も高い第1位~第80位のssj_ops/W結果は、すべてAMD EPYCプロセッサを搭載したものであった。SPECrate®2017 Integer (Energy Base)については、上位11位のSPECrate®2017_int_energy_base性能/システムWスコアにAMD EPYC CPUが搭載されています。SPECrate®2017 Floating Point (Energy Base)については、AMD EPYC CPUがSPECrate®2017_fp_energy_base性能/システムWスコアの上位12位を占めています。VMmark®サーバーの消費電力性能(PPKW)については、2ソケットおよび4ソケットのマッチドペアの結果の上位4つが他のすべてのソケットの結果を上回り、VMmark®サーバーおよびストレージの消費電力性能(PPKW)については、総合スコアの上位を占めています。全リストは https://www.amd.com/en/claims/epyc4#faq-EPYC-028C を参照のこと。SPEC® に関する詳細は、http://www.spec.org を参照のこと。SPEC、SPECrateおよびSPECpowerは、Standard Performance Evaluation Corporationの登録商標である。VMmark は、米国およびその他の国における VMware の登録商標である。
SP5-144:2023年5月2日時点のAMD内部リファレンス・プラットフォームおよびAmpereプラットフォームの両プロセッサの測定結果に基づく、サーバーサイドJava®の最大オペレーション/秒の推定値比較。テストは、1グループあたり16個のvCPUを使用し、SLAポイントがオーバーするまで各グループをスケールアップして実施(通常、CPU使用率は100%に近い)。構成 2P 128コア EPYC 9754(~39.3万サーバーサイドJava®最大処理/秒、16グループ実行)搭載サーバーと2P 128コア Altra Max M128-30(~13万サーバーサイドJava®最大処理/秒、8グループ実行)搭載サーバーの比較では、~2.6倍のパフォーマンス。OEMが公表するスコアは、使用するシステム構成および決定論モード(デフォルトのパフォーマンス・プロファイル)によって異なります。
SP5-145:2023年3月31日時点における両プロセッサのAMDリファレンス・プラットフォーム内部測定値に基づく、サーバーサイドJava®の推定動作/秒/W比較。構成 2P 128コアEPYC 9754(~29KサーバーサイドJava®総合動作/秒/W、総TDP 720W)搭載サーバーと、2P 128コアAltra Max M128-30(~8.4KサーバーサイドJava®総合動作/秒/W、総TDP 500W)搭載サーバーの、システムWあたり~3. OEM が公表するスコアは、システム構成および使用する決定論モード(デフォルトのパフォーマンス・プロファイル)によって異なります。2 SP5-141: ebizzy レコード/秒の比較は、2023 年 3 月 31 日時点の Phoronix Test Suite の有料テストに基づきます。構成 2P 128コアAMD EPYC 9754(5,272,631レコード/秒、平均W 480W、~868ジュール/ラン)搭載サーバーと2P 128コアAltra® Max M128-30(774,541レコード/秒、平均W 313.7W、~7257ジュール/ラン)の比較では、~88%少ないジュールで6.8倍のパフォーマンス。テストはAMDによって独自に検証されたものではありません。スコアは、システム構成および使用する決定論モード(320W cTDPパフォーマンス・プロファイル)によって異なります。
3 SP5-142:2023年3月31日時点のPhoronix Test Suiteの有償テストに基づくApache Cassandra 4.0のストレス(書き込み)比較。構成 2P 128コアAMD EPYC 9754(226,691op/s、平均消費電力327.1W、~3544ジュール/run)搭載サーバーと2P 128コアAltra® Max M128-30(114,006op/s、平均消費電力174.4W、~25,981ジュール/run)の比較では、86%少ないジュールで1.98倍のパフォーマンス。テストはAMDによって独自に検証されたものではありません。スコアは、システム構成および使用した決定論モード(320W cTDPパフォーマンス・プロファイル)によって異なります。
4 VMware Compatibility Guide https://www.vmware.com/resources/compatibility/search.php(2023年4月19日現在)に基づく。

 

一覧に戻る