AMD Accelerated Data Center Premiereでより個々のニーズに応じたデータセンターコンピューティングの未来を紹介

データセンター

2022-03-24更新

  • twitter
  • facebook
  • line

リモートワーカーが増え、メディアストリーミングが爆発的に普及し、科学的なインサイトをより迅速に得ようとする動きが加速している今、企業や組織は、データセンターの拡大するニーズに対応するソリューションを求めています。11月8日、Lisa Su博士がAMDのデータセンター技術革新を複数発表しました。テクニカルコンピューティング向けの新テクノロジー、エクサスケールクラスのアクセラレーター、そして「Zen 4」データセンター製品の先行情報が披露されました。

「Milan-X」を紹介

6月のComputexで新しい3Dチップレットテクノロジーのプレビューを行い、現在は、AMD 3D V-Cacheテクノロジーを搭載した第3世代AMD EPYC™プロセッサー(以前のコード名は「Milan-X」)を世界に展開しています。現在は大量生産されているこの製品は、真の3Dダイスタッキングを備えた初のx86 CPUです。このスタッキングにより、標準の第3世代AMD EPYCプロセッサーと比較して3倍のL3キャッシュが可能になり、メモリ帯域幅の負荷が軽減され、リーダーシップのパフォーマンスが向上します。これは、最も演算負荷の高いワークロードの1つである製品設計にとってどのような意味があるのでしょうか。

・シミュレーションの高速化により、設計チームは問題を迅速に解決し、設計サイクルを短縮して、早期に市場投入することが可能に
・同じ時間でより多くの作業と設計を繰り返し行うことができるため、品質が向上し、革新的な製品が開発される

また、主要なISVやOEMと協力して、顧客向けのターンキーソリューションも開発中です。AMD 3D V-Cacheを搭載した第3世代AMD EPYC™プロセッサーは、既存の「Milan」プロセッサーと完全互換性があるため、プラットフォームにドロップイン交換可能。AMD 3D V-Cache搭載の第3世代AMD EPYC™プロセッサーをベースとしたソリューションは、2022年第1四半期から提供開始予定です。

エクサスケール時代到来

現在、科学者や研究者は、人類史上最大の課題や機会に直面しています。病気の治療のための迅速な創薬、気候変動の理解と準備のための気象モデリング、より効率的な燃料とエネルギー源の探索には、かつてないスピードで大量のデータを分析する必要があります。

このようなグローバルな課題に向けたAMDの強力な新しい貢献とは何か。新商品、世界最速のHPC・AI向けのAMD Instinct™MI200シリーズアクセラレーターです。(1)競合GPUよりもHPCアプリケーションのパフォーマンスが4倍に向上し、計算科学研究者が世界で最も困難な問題を解決する一助となることが期待されます。(2)

MI200は、第3世代AMD EPYC™CPUと共に、オークリッジ国立研究所のスーパーコンピューター「Frontier」にも搭載される予定です。Frontierはエクサスケール・コンピューティングに対応しています。つまり、1秒あたり10億回の演算を実行できるということです。エクサスケール時代が到来し、その先陣を切るのがAMDです。

次世代

AMDは、データセンターの水準をさらに高めるためにロードマップを実行し、さらなる技術革新を推進することに取り組んでいます。そこで、「Zen 4」マイクロアーキテクチャをベースとした次世代のEPYCプロセッサーラインの計画を発表しました。コード名は「Genoa」と「Bergamo」です。第4世代AMD EPYCプロセッサーの主力製品である「Genoa」は、来年発売される汎用コンピューティング向けに世界最高のパフォーマンスを発揮するプロセッサーとして設計されています。「Bergamo」は、クラウドネイティブコンピューティング専用の専用CPUで、キャッシュコアと消費電力を最適化して、クラウドネイティブアプリケーションのニーズに対応します。また、「Genoa」とソケット互換性があるため、すでに認定されている同じプラットフォームで導入可能です。

これは始まりにすぎない

AMDはまだ歩みを緩めません。カスタマイズされたアプローチで顧客のあらゆるワークロードに対応する革新的なソリューションで、引き続きデータセンターの最新化を推進していきます。

基調講演を見逃した方はオンデマンド(英語)で視聴できます。

脚注

1.世界最速のデータセンターGPUはAMD Instinct™MI250Xです。AMDパフォーマンスラボが行った、AMD Instinct™MI250X(128GB HBM2e OAMモジュール)アクセラレーターのピークブーストエンジンクロック1,700MHzでの計算値による浮動小数点演算の理論ピーク性能は、倍精度(FP64 Matrix)95.7TFLOPS、倍精度(FP64)47.9TFLOPS、単精度行列(FP32 Matrix)95.7TFLOPS、単精度(FP32)47.9TFLOPS、半精度(FP16)383.0TFLOPS、Bfloat16フォーマット精度(BF16)383.0TFLOPSです。AMDパフォーマンスラボが行った、AMD Instinct™MI100(32GB HBM2 PCIe®カード)アクセラレーターのピークブーストエンジンクロック1,502MHzでの計算値による浮動小数点演算の理論ピーク性能は、倍精度(FP64)11.54TFLOPS、単精度マトリックス(FP32)46.1TFLOPS、単精度(FP32)23.1TFLOPS、半精度(FP16)184.6TFLOPSです。NVIDIA Ampere A100(80GB)GPUアクセラレーターのブーストエンジンクロック1410MHzでの公表値による浮動小数点演算の理論ピーク性能は、倍精度Tensorコア(FP64 Tensorコア)19.5TFLOPS、倍精度(FP64)9.7TFLOPS、単精度(FP32)19.5TFLOPS、半精度(FP16 Tensorコア)312TFLOPS、Bfloat16(BF16)39TFLOPS、Bfloat16フォーマット精度(BF16 Tensor Flow)312TFLOPSです。TF32データフォーマットはIEEE不適合のため、この比較には含まれていません。https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper、MI200-01 P15表1

2.AMDパフォーマンスラボが2021年9月15日に行った、AMD Instinct™MI250(128GB HBM2e OAMモジュール)アクセラレーターのピークブーストエンジンクロック1,700MHzでの計算値による浮動小数点演算の理論ピーク性能は倍精度(FP64)45.3TFLOPSです。AMD パフォーマンスラボが2020年9月18日に行った、AMD CDNA 7nm FinFETプロセスで設計したAMD Instinct™ MI100のピークブーストエンジンクロック1,502MHzでの計算値による浮動小数点演算の理論ピーク性能は倍精度(FP64)11.535TFLOPSです。NVIDIA Ampere A100(80GB)GPUアクセラレーターの公表値による浮動小数点演算の理論ピーク性能は倍精度(FP64)9.7TFLOPSです。計算結果はこちら https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper… MI200-08

一覧に戻る