高性能コンピューティングとAIトレーニングにおけるAMD 30×25エネルギー効率目標

2022-06-22更新

  • twitter
  • facebook
  • line

インターネットに接続されたプロセッサーやカメラを搭載した「スマートデバイス」の普及に伴い、世界中のデータは爆発的に増え続けています。この膨大なデータの解析を可能にし、より質の高い分析、自動サービス、セキュリティの強化、その他多くの目的につながるのが、人工知能(AI)と高性能コンピューティング(HPC)といった技術で、コンピューター業界に変化をもたらしています。しかし、こうした高度な計算の規模が大きくなるにつれて、より多くのエネルギーが消費されるという課題があります。AMDは、高性能プロセッサーを開発する企業として、最先端を走り続けています。製品開発においてはエネルギー効率を優先してきました。アーキテクチャー、パッケージング、コネクティビティ、ソフトウェアといった部分で電力を最適化する設計を行っています。エネルギー効率に重点を置くことで、コストの削減を実現すると共に、天然資源の保護や気候への影響の軽減を目指しています。

実はAMDがエネルギー効率を優先させることは、新しいことではありません。実際、私たちは2014年に、2020年までにモバイル・プロセッサーを標準的に使用した際のエネルギー効率を25倍まで加速させるという目標を自主的に設定しています。そして私たちは31.7倍の改善を実現し、設定していた目標を大きく上回りました。

AMD EPYC™ CPUとAMD Instinct™アクセラレーターを搭載したノードは、AIトレーニングやHPCアプリケーションなど、世界で最も急成長しているコンピューティング・ニーズに対応するよう設計されています[i]。 これらのアプリケーションは、気候予測、ゲノム、創薬などの科学研究、音声認識、言語翻訳、専門家による推薦システム用のAIニューラルネットワークのトレーニングに不可欠です。これらのアプリケーションの計算機需要は指数関数的に増大しています。私たちのアーキテクチャーの革新により、これらのアプリケーションや、他のアプリケーションの計算ノードのエネルギー使用を最適化することが可能であると信じています。

アプリケーションに特化したアクセラレーション・コンピュート・ノードによる効率化

AMDは、業界と共に、データセンターの効率向上が温室効果ガス排出量の削減と環境の持続可能性の向上に役立つと考えています。例えば、世界のすべてのAIおよびHPCサーバー・ノードが同様に改善した場合、ベースラインの業界動向と比較して、2021年から2025年にかけて最大510億キロワット時の電力が節約でき、これは62億米ドルの電力節約と同等で、6億本の木が10年間吸収する二酸化炭素量に相当すると予測しています[ii]。

実際、30倍の目標を達成するということは、2025年に、これらのAMDアクセラレーション・コンピュート・ノードが1つの計算を完了するのに必要な電力が、2020年に比べて97%削減されることを意味します。そこに到達するのは簡単なことではありません。この目標を達成するには、2015年から2020年の間に業界全体で行われる改善の総計の2.5倍以上の速度で、アクセラレーション・コンピューティング・ノードのエネルギー効率を高める必要があることを意味します[iii]。

1年間の進捗状況

さて、私たちはどうなっているのでしょうか?2022年のほぼ半ばに、第3世代 AMD EPYC™ CPU 1個と AMD Instinct™ MI250x GPU 4個を搭載した高速コンピューティング・ノードを使用して、エネルギー効率を2020年の基準値から6.79倍改善し、30×25達成に向けて順調に推移しています。この進捗報告書は、著名なコンピュートエネルギー効率研究者兼著者のJonathan Koomey博士によって検証された測定方法[iv]を利用しています。

2022年、30×25エネルギー効率目標に関する最新情報。AMDの実績は、30X目標の達成に向けて順調に推移しており、2015年から2020年までの業界の改善傾向を大きく上回っています。

AIトレーニングおよびHPCワークロードを実行するデータセンターのコンピューティング・ノードの世界的なエネルギー使用量比較予測。出典 AMD社内データ

上の図に見られるように、ビジネス・アズ・ユージアルの「ベースライン産業トレンド」は、2015~2020年のデータで観察されたのと同じ過去のトレンドに従って、2020~2025年の世界のエネルギー使用量を推定しています。AMDの目標トレンドラインは、AMD 30×25目標が示す効率向上とエネルギー消費量の低下という望ましい結果に基づく世界のエネルギー使用量を示しています。AMDの実際のトレンドラインは、現在までに報告されたAMDコンピューティング・ノードのエネルギー効率向上に基づく世界のエネルギー使用量を示しています。

30×25の目標達成にはまだまだ時間がかかりますが、私は当社のエンジニアの仕事に満足し、これまでの結果に勇気づけられています。今後も毎年、進捗状況を報告していきますので、ぜひご覧ください。

こちらの記事はAMD本社のブログ記事を機械翻訳したものです。詳しくは元記事をご覧ください。

注意事項:

このブログには、1995年私募証券訴訟改革法のセーフハーバー規定に基づく、AMDの30×25目標に関連するAdvanced Micro Devices, Inc.(AMD)に関する将来予測に関する記述が含まれています。将来予測に関する記述は、一般的に「だろう」、「かもしれない」、「期待する」、「信じる」、「計画する」、「意図する」、「計画する」といった言葉や、同様の意味を持つ他の言葉で識別されます。本ブログに記載されている将来の見通しに関する記述は、現時点における判断、仮定および予測に基づくものであり、本プレゼンテーションの日付(2022年5月4日)時点におけるもので、リスクや不確実性を含んでおり、実際の結果は現在の予測とは大きく異なる可能性があることにご注意ください。こうした記述は、特定の既知および未知のリスクおよび不確実性(その多くは予測が困難であり、一般にAMDが制御できない)の影響を受け、実際の結果およびその他の将来の事象が、将来予測情報および記述で表現または暗示もしくは予測されたものと著しく異なる可能性があります。投資家の皆様には、AMDのフォーム10-Kおよび10-Qに関する最新の報告書を含むがこれに限定されない、AMDの証券取引委員会提出書類のリスクおよび不確実性を詳細に検討されるようお勧めします。AMDは、法律で義務付けられている場合を除き、本ブログに記載されている将来予測に関する記述を更新する義務を負わず、またここにその義務を否認します。

脚注:

[i] AIトレーニングおよびHigh-Performance Computingに使用されるAMDの高性能CPUおよびGPUアクセラレーター(4アクセラレーター、CPUホスティング構成)を含む。目標計算は、標準的な性能指標によって測定された性能スコアに基づいています(HPC: Linpack DGEMM カーネル FLOPS、4k マトリックスサイズ。AI トレーニング:4k マトリックスで動作する FP16 または BF16 FLOPS などの低精度トレーニング重視の浮動小数点演算 GEMM カーネル) を、CPU ホスト + メモリ、および 4 つの GPU アクセラレーターを含む代表的な高速計算ノードの 定格消費電力で割ったものです。

[ii] 世界のすべてのAIおよびHPCサーバー・ノードがAMDの30倍目標に近い成果を上げ、ベースラインである2020年のトレンドと比較して、2021年から2025年にかけて最大514億キロワット時の累積電力削減を実現した場合のシナリオです。1kwhあたり0.12セント×514億kwh=620万米ドルを想定しています。 CO2e 排出量のメトリックトン、および植林に相当する見積もりは、2021 年 12/1 に米国 EPA 温室効果ガス等価計算機に電力節約量を入力したものである。https://www.epa.gov/energy/greenhouse-gas-equivalencies-calculator

[iii] 2015年から2020年のエネルギー効率向上に関する業界動向と2025年のデータセンターのエネルギー消費量に基づく。

[vi] AMD CPUソケットとGPUノードの電力消費量にセグメントごとの利用率(アクティブとアイドル)を組み込み、PUEを乗じてワットあたりの性能を計算するための実際の総エネルギー使用量を決定します。

6.79x = (2025年のベースケースHPCノードkWhr使用量予測 x DGEMMと標準的なエネルギー消費を用いたAMD 2022年のパフォーマンス/ワット改善 + 2025年のベースケースMLノードkWhr使用量予測 * ML計算と標準的エネルギー消費を用いたAMD 2022年のパフォーマンス/ワット改善) /(2020 perf/Watt * 2025年のベースケース予測kWhr使用量). 目標と方法論の詳細については、https://www.amd.com/en/corporate-responsibility/data-center-sustainability をご覧ください。

一覧に戻る