第4世代 AMD EPYC™ プロセッサーがコンピューター・グラフィックスに命を吹き込む

AMD EPYC™ プロセッサー

2023-06-07更新

  • twitter
  • facebook
  • line

CGは、その名の通り、コンピューターを使って静止画や動画を生成・加工し、アートプロジェクト、建築、印刷メディア、シミュレーション、映画、ビデオ、ビデオゲームなど、さまざまな用途で使用されます。CGは70年代初頭に映画業界から登場し、80年代には映画界で主流となりました。ミュージックビデオも同じ時期にCGを取り入れ始め、1995年には長編映画のすべてがCGコンテンツで制作されるようになりました[1]。今日、ますます多くの業界、アプリケーション、ユースケースでCGが採用され、その目的はますます拡大しています。このブログでは、メディアとエンターテインメント、特に高解像度、高品質の動画やアニメーションのレンダリングに焦点を当て、デスクトップやラップトップPCからテレビ、タブレット、電話まで、さまざまなエンドユーザー機器にデジタル配信されることが多くあります。ここでは、レンダリングとストリーミングについて少し説明し、第4世代 AMD EPYC™ プロセッサーがメディアおよびエンターテインメントのワークロードに最適である理由をいくつかの例で紹介したいと思います。

レンダリングとストリーミング

3Dモデルなどのデジタル資産を、静止画や動画に変換する作業をレンダリングと呼びます。現在のハイエンドな4K・8Kレンダリングでは、静止画1枚あたり約830万画素、アニメーション1フレームあたり3300万画素以上が必要となります。レンダリングは、コンピューターに多大な負荷をかける作業です。より大きな解像度を処理し、より高い品質の結果をより速く提供できるコンピュータープロセッサーが求められています。

お気に入りのテレビ番組を見るために1週間の予定を立てたり、ビデオデッキのプログラムを組むために格闘したりした時代は過去のものとなりました。静止画やアニメのコンテンツを、固定されたスケジュールではなく、オンデマンドで配信する傾向が強まっています。YouTubeはその好例で、好きな時間に好きな動画を見ることができ、そのコンテンツは選んだデバイスに適したフォーマットと解像度で表示されます。サーバーからエンドデバイスにオンデマンドでコンテンツを配信するプロセスをストリーミングと呼びます。ストリーミングは、コンテンツを取得し、エンドデバイスで使用可能な形式に変換し、エンドデバイスにリアルタイムで送信しなければならないコンピュータープロセッサーに多大な負担をかけることになります。

「EPYC」コンテンツの配信

第4世代 AMD EPYC™ プロセッサーは、このM&E分野の需要にどのように応えているのだろうか。 このセクションでは、まさに「epyc」な結果を紹介します。

・Autodesk® Arnold(オートデスク アーノルド): Autodesk Arnoldは、VFXやアニメーション制作のために設計された高度なモンテカルロ・レイトレーシング・レンダラーです。Maya、Houdini、3ds Max、Cinema 4D、Katanaなど、デジタルアーティストが使用するトップツールとプラグインで連携できるように設計されています。AMDは、第4世代 AMD EPYC™ 9654 プロセッサーを、第3世代 AMD EPYC™ 7763 プロセッサーとインテル® Xeon® Platinum 8380プロセッサーの両方とテストしました。これらのプロセッサーはそれぞれ、そのプロセッサー・ファミリーまたは世代の「トップ・オブ・スタック」を意味します。第3世代 AMD EPYC™ 7763 は、gtcrobotおよびsimaシーンのレンダリングにおいて、 Intel Xeon Platinum 8380 に対してそれぞれ約1.45倍および約1.56倍の競争力アップを見せました。これらはどちらも素晴らしい結果ですが、第4世代 AMD EPYC™ 9654 プロセッサーは、 Intel Xeon Platinum 8380 と比較して、同じシーンのレンダリングでそれぞれ~2.74倍、~2.42倍という圧倒的な上昇を実現しています。第4世代 AMD EPYC™ のアップリフトを第3世代 AMD EPYC™ のアップリフトで割ると、世代間のアップリフトはそれぞれ約1.88倍と約1.55倍となっています[2]。

図1:Autodesk Arnoldを実行する第4世代と第3世代の AMD EPYC™ およびインテル® Xeon®プロセッサーの比較

・Chaos® V-Ray®: Chaos V-Ray5は、3ds Max、Cinema 4D、Houdini、Maya、Nuke、Revit、Rhino、SketchUp、Unrealといった主要な3DデザインおよびCADプログラムでシームレスに動作する3Dレンダリングプラグインです。V-rayは、アーティストやデザイナーがリアルタイムでレイトレーシングを行い、高品質の3Dビジュアライゼーションをレンダリングする機能で、プロジェクトを作成・共有することができます。映画やテレビの制作、広告、建築のビジュアライゼーションに広く利用されています。第4世代 AMD EPYC™ 9654 プロセッサーは、第3世代 AMD EPYC™ 7763 プロセッサーに対して、圧倒的で世界記録となる1.98倍の世代間性能アップを実現しました。[3]

図2:Chaos V-Rayを実行する第4世代と第3世代の AMD EPYC™ プロセッサーの比較(単位:vsamples)

・FFmpeg: FFmpegは、レガシーからウルトラモダンまで、事実上あらゆるフォーマットのあらゆるタイプのビデオをエンコード、デコード、トランスコード、ストリーム、フィルタリング、再生することができるマルチメディアフレームワークです。FFmpegは、さまざまなオペレーティングシステム、環境、および構成で動作します。第3世代 AMD EPYC™ 7763 プロセッサーは、 Intel Xeon 8380 Platinum プロセッサーと比較して1.25倍、第4世代 AMD EPYC™ 9654 プロセッサーはさらに素晴らしい1.35倍のアップリフトを示しました。第4世代 AMD EPYC™ のアップリフトを第3世代 AMD EPYC™ のアップリフトで割ると、世代間のアップリフトは1.08倍となります[4]。

図3:第4世代と第3世代の AMD EPYC™ と Intel® Xeon® プロセッサーのFFmpegの動作の比較

・Synamedia® Virtual Digital Content Manager (vDCM):Synamedia vDCMは、多くのビデオフォーマットに対応したライブ配信のために、ソフトウェアベースの高度な仮想化ビデオ、オーディオ、メタデータ処理を提供するものです。放送局、コンテンツプロバイダー、サービスプロバイダーは、高画質とマルチスクリーントランスコーディングを含む優れた視聴体験を、高い帯域幅効率で提供することができます。Synamediaのテストによると、第4世代 AMD EPYC™ 9654 プロセッサーは、幅広いビデオビットレート、解像度、フレームレート、フォーマットにおいて、わずか50%増のプロセッサーコアで第3世代 AMD EPYC™ 7763 プロセッサーに比べて平均約74%の世代別ビデオエンコーディング性能向上を実現したことがわかりました。第4世代 AMD EPYC™ 9654 プロセッサーを搭載したデュアル・プロセッサー・システム1台で、2つの8Kビデオストリームを60フレーム/秒で同時にトランスコードすることができます[5]。

図4:Synamedia vDCMの世代別性能アップの推移

・Visionular AV1コーデック: Visionular AV1コーデックは、高いパフォーマンスと忠実なレンダリングを提供する高度なビデオコーディングフォーマットです。Visionularのテストでは、第4世代 AMD EPYC™ 9654 プロセッサーは、crowd_runシーンのエンコード時に、第3世代 AMD EPYC™ 7763 プロセッサーに比べて1.66倍高いフレームレートで8つの同時ビデオストリームをエンコードしました。Tears_of_Steel のシーンでは、第4世代 AMD EPYC™ 9654 プロセッサーは、第3世代 AMD EPYC™ 7763 プロセッサーの約1.55倍のフレームレートで8つの同時ストリームをエンコードしました。この結果は、わずか50%増のコアで、世代を超えた約2倍の性能向上を示しています[6]。

図5:Visionularの世代別パフォーマンスアップ率

まとめ

AMD EPYC™ プロセッサーは、すでにメディア・エンターテインメント業界に強力な進出を果たしており、第4世代 AMD EPYC™ プロセッサーは、この業界において引き続き性能向上を実現しています。第4世代 AMD EPYC™ プロセッサーは、レンダリングからエンコード、デコード、静止画およびアニメーション・コンテンツのトランスコードまで、メディアおよびエンターテインメントのワークロードに最適です。その優れた性能により、より高解像度のコンテンツをレンダリングし、ストリーミング・コンテンツをより高速に配信することができます。また、このプロセッサーのコアおよびスレッド密度の高さにより、より少ないサーバーで現在のワークロードを処理することができるかもしれません。いずれにせよ、第4世代 AMD EPYC™ プロセッサーは、現在および将来のデジタル・メディアをこれまで以上に迅速かつ高品質で配信するのに役立ちます。これぞエンターテインメントです!

本記事の執筆者Raghu Nambiarは、AMDのCorporate Vice President of Data Center Ecosystems and Solutionsです。彼の投稿は彼自身の意見であり、AMDの立場、戦略、意見を代表するものではない場合があります。第三者のサイトへのリンクは便宜上提供されているものであり、明示されていない限り、AMDは当該リンク先サイトのコンテンツに責任を負わず、いかなる推奨も示唆されません。

こちらの記事はAMD本社のブログ記事を機械翻訳したものです。詳しくは元記事をご覧ください。

 

脚注:

  1. https://en.wikipedia.org/wiki/Computer-generated_imagery
  2. Please see https://www.amd.com/system/files/documents/epyc-9004-pb-arnold.pdf.
  3. SP5-038B: V-Ray based on published scores from https://benchmark.chaos.com/v5/vray as of 1/10/2023. Comparison of 2P AMD EPYC 9654 (209,102 max vsamples, https://benchmark.chaos.com/v5/vray/38531) is 2.24x the performance of published 2P Intel Xeon Platinum 8490H (93,210 max vsamples, https://benchmark.chaos.com/v5/vray/29746). 2P EPYC 7763 (109,248 vsamples, https://benchmark.chaos.com/v5/vray/12888) shown at 1.17x and 2P Intel Xeon Platinum 8380 (62,919 vsamples, https://benchmark.chaos.com/v5/vray/29746) shown at 0.68x for reference. Chaos®, V-Ray® and Phoenix FD® are registered trademarks of Chaos Software EOOD in Bulgaria and/or other countries. NOTE: Red text only needs to be included with charts that show the 7763/8380.
  4. Please see https://www.amd.com/system/files/documents/epyc-9004-pb-ffmpeg.pdf.
  5. See https://www.synamedia.com/whitepapers-reports/scaling-video-encoding-performance/ (registration required). Results not verified by AMD.

SP5-132: Testing performed by Visionular on Aurora1 AV1 version 1.3.10, showing performance running 8 concurrent encoding streams using the crowd_run scene (https://media.xiph.org/video/derf/y4m/crowd_run_2160p50.y4m) and the Tears of Steel scene (https://visionular-release.s3.ap-northeast-1.amazonaws.com/y4m/tearsofsteel-2160p-40s.y4m), with each system using 128 threads. All performance data was provided by Visionular. Results are specific to Visionular and may not be typical. Systems configurations: CPU: Two AMD EPYC 9654 CPUs, 2.4 GHz | 3.7 GHz, 96 cores per socket (192 cores per node), TDP 400 W, 384 MiB L3 per CPU; RAM: 1.5TiB (24) Dual-Rank DDR5-4800 64GiB DIMMs, 1DPC; NIC: Broadcom Inc. NetXtreme BCM5720 Gigabit Ethernet (tg3:  5.15.0-48-generic); Storage: Samsung SSD 970 EVO Plus 500GB | Four 2.9TB NVMe drives; BIOS: AMI Core Ver. 5.25, Project Ver. RTI1000F and Default BIOS setting (SMT=on, X2APIC=on, IOMMU=Auto, APBDIS=Auto, Fixed SOC P-state=Auto, Determinism=power, NPS=1, DF C-states=Auto); OS: Ubuntu 20.04.4, OS Settings Default versus: CPU: Two AMD EPYC 7763 CPUs, 2.45 GHz | 3.5 GHz, 64 cores per socket (128 cores per node), TDP 280 W, 256 MiB L3 per CPU; RAM: 2TiB (32) Dual-Rank DDR4-3200 64GiB DIMMs, 1DPC; NIC: Broadcom Inc. NetXtreme BCM5720 Gigabit Ethernet (tg3:  5.15.0-48-generic); Storage: Samsung SSD 970 EVO Plus 500GB | Four 2.9TB NVMe drives; BIOS: AMI Core Ver. 4, Project Ver. RYM 1008B and Default BIOS setting (SMT=on, X2APIC=on, IOMMU=Auto, APBDIS=Auto, Fixed SOC P-state=Auto, Determinism=power, NPS=1, DF C-states=Auto); OS: Ubuntu 20.04.4, OS settings Default.

一覧に戻る