RDNA 2。AMDの最新鋭グラフィックスカード、Radeon RX 6000の中核を成すグラフィックスアーキテクチャは、従来型の「RDNA」GPUの単純な反復版のように聞こえるかもしれませんが、次世代Xbox Series XやPlayStation 5にも搭載されているRDNA 2は、単なるリフレッシュではありません。大幅な改良により、AMDの前世代Radeon RX 5000 GPUと比較して、ワットあたりの消費電力が驚異の54%向上しました。さらに注目すべきは、Radeon RXが革新的な新技術「Infinity Cache」を導入し、グラフィックスカード内のメモリの挙動を根本から刷新した点です。そして、レイトレーシングも搭載されています。AMDはついにレイトレーシングも実現しました。
これらすべてを合わせると、本日発表されたRadeon RX 6800シリーズグラフィックスカードは、久しぶりにNVIDIAのエンスージアスト向けゲーミングフラッグシップに匹敵する性能を発揮します。その実力については、Radeon RX 6800とRX 6800 XTのレビューをご覧ください。RDNA 2アーキテクチャのハイレベルな概要を読めば、AMDがどのようにしてこの性能を実現したのかがお分かりいただけるでしょう。
RDNA 2 アーキテクチャの変更

AMDのエンジニアたちは、高い効率目標を掲げてRDNA 2の開発に取り組みました。オリジナルのRDNAアーキテクチャは、「GCN」ベースの前世代機と比較してワットあたりの性能が50%向上し、ついにNvidiaが誇る電力効率に匹敵しました。そして、同社の幹部たちはRDNA 2でもそのペースを維持することを望んでいました。そして、ネタバレ注意:彼らはそれを達成しました。しかし、RDNA 2はRDNA 1と同じTSMC 7nm製造プロセスを使用して構築されているため、Ryzen CPUアーキテクチャチームとの緊密な連携に加え、多大な努力が必要でした。オリジナルのRDNAの効率向上の大部分は、14nmから7nmへのノードの飛躍によるものでしたが、RDNA 2の改善には、より大幅な調整が必要でした。


徹底的な再調整にもかかわらず、RDNA 2 の基本的な構成要素は、専用のレイ アクセラレータ ハードウェアの追加 (後述) を除けば、大まかには RDNA 1 とほぼ同じままで、スケールが大幅に拡大されただけです。

AMDは前世代のRDNA 1製品では控えめな価格設定を維持しました。主力製品であるRadeon RX 5700 XTは、251mm²のダイに40基の演算ユニットと103億個のトランジスタを搭載しました。これは、AMDの以前のGCNアーキテクチャが最大64基のCU設計までスケールアップしていたことを考えると驚きです(その理由についても後ほど説明します)。RDNA 2はそれをはるかに超えています。579ドルのRadeon RX 6800は60基のCUを搭載し、649ドルのRadeon RX 6800 XTはそれを72基に増やし、そして主力製品である999ドルのRadeon RX 6900 XTは、前世代のRX 5700 XTの2倍となる80基のCUと260億個以上のトランジスタを搭載する巨大な519mm²のダイに搭載されています。対照的に、Nvidia のライバル製品である 1,500 ドルの GeForce RTX 3090 に搭載されている「Ampere」GPU ダイには、はるかに大きな 628mm² のダイに 280 億個を超えるトランジスタが詰め込まれています。
AMDの素晴らしいRyzen 5000 CPUを参考にしたRDNA 2は、広範囲にわたる細粒度クロックゲーティングを実装し、使用されていないGPUの部分の速度を低下させて電力効率を改善しています。RDNA 2は同じ理由で、より堅牢なクロックツリー分割とゲーティング(サーバーCPUなど)を備えていますが、GPUで可能なより高い帯域幅に到達するためにより並列化されています。同社のエンジニアは、データパイプラインのバランスを「積極的に」取り直し、データパス全体を再設計して、アーキテクチャを最大効率に磨き上げました。これらの最適化は、Radeon RX 6800と6800 XTで実現された最大54%のワットあたりパフォーマンスの向上(および12月8日に登場する主力製品Radeon RX 6900 XTで約束された驚異の65%の向上)の約3分の1を占めています。

ただし、ワットあたりのパフォーマンスは電力効率だけの問題ではありません。「パフォーマンス」という言葉が使われているのはそのためです。RDNA 2のワットあたりのパフォーマンス向上の3分の1は、アクセルペダルをさらに踏み込んだことによるものです。AMDのエンジニアは、ここでも速度を重視し、マイクロアーキテクチャ、ロジック、パフォーマンスライブラリを最適化しました。彼らの努力の最も具体的な成果は、Radeon RX 6000 GPUの驚異的なクロック速度でしょう。AMDのCPUエンジニアは、この時点で7nmプロセスノードでの速度向上に長い時間を費やしており、その専門知識をRadeonチームと共有することで大きな成果を上げました。
Radeon RX 6000シリーズのグラフィックスカードは、2GHzの壁をはるかに超えています。AMDの代表者は、報道陣との会話の中で「前例のない」速度を熱心に宣伝していましたが、それも当然です。ハイエンドモデルであるRadeon RX 6800、6800 XT、6900 XTの3機種はすべて、ブーストクロック速度が驚異の2.1GHzを超えています。XTモデルの2機種は最大2,250MHzまで上がります。これは理想的な条件下での数値ですが、AMDによると、XTカードはゲーミングワークロードでも2,015MHzに達し、ゲームプレイ中に約2GHzまでブーストアップできるNvidiaの驚異的な高性能Ampere GPUに匹敵する性能を発揮します。
AMD は、RDNA 2 の革新的な Infinity Cache を導入しなければ、これほど高速化したり、電力効率の目標を達成したりすることはできなかったでしょう。
RDNA 2 インフィニティキャッシュの説明

RDNA 2の目玉機能もまた、プロセッサ設計、つまりEpycサーバープロセッサからヒントを得ています。従来のGPUには、様々なサイズのL1キャッシュとL2キャッシュが搭載されています。Radeon RX 6000グラフィックスカードは、「Infinity Cache」を搭載しています。これは「Game Cache」と同様に動作し、最新のRyzenプロセッサのゲーム性能を以前のモデルよりもはるかに向上させています。EpycサーバーCPUに着想を得たInfinity Cacheは、基本的に128MBの大容量L3キャッシュで、ゲームワークロード向けに高度に最適化されています。EpycプロセッサのL3 SRAMの4倍の密度を誇り、電力効率の向上にも貢献しています。

GPUに大容量かつ高速なキャッシュを搭載することで、特定のフレームの作業データの大部分をオンダイで保持できます。これにより、GPUは多くの場合、パッケージ全体を経由して16GBのオンボードGDDR6メモリに信号を送り続ける必要がなくなります。特に、キャッシュには後続のフレームで再利用できる大量の時間的および空間的データが格納されるため、その効果は顕著です。そのため、Infinity Cacheは、メモリモジュールへのバス幅を単純に増やす場合と比較して、はるかに高速で電力効率に優れています。
AMDの製品技術アーキテクトであるサム・ナフジガー氏は、Radeon RX 6000 GPUは控えめな256ビットバスを採用しているものの、Infinity Cacheにより、RDNA 2は従来のGDDR6(たとえ512ビットバスを搭載していたとしても)よりもはるかに高いワットあたりの帯域幅を実現していると述べています。比較すると、NvidiaのライバルであるハイエンドのRTX 3080および3090グラフィックスカードは、それぞれ320ビットおよび384ビットのより広いバスを採用し、「PAM4」シグナリングテクノロジーを採用した最先端のGDDR6Xメモリを搭載しています。これにより、従来の2つから4つの値をサイクルごとに送信できます。これにより、GDDR6XはGDDR6の2倍の速度でデータを転送できますが、レイテンシと消費電力が増加します。

Infinity Cacheは、RDNA 2の驚異的なクロック速度の実現にも貢献しています。AMDがRDNA 2にオリジナルのRDNAメモリサブシステムを強制的に搭載しようとした場合、GPUの帯域幅不足を回避するために、はるかに大規模なメモリ構成が必要になっただろうとナフィッツィガー氏は述べています。そうなると、巨大な512ビットバスへのアップグレードと、より多くの高速メモリへのアップグレードが必要になり、その結果、電力需要が急増することになります。RDNA 2の設計目標を考えると、これは不可能なことでした。
上のグラフからわかるように、Infinity Cache によって実現される圧倒的な帯域幅により、RDNA 2 の CU には十分な電力が供給されています。AMD のエンジニアがラボで Infinity Cache を無効にし、256 ビットバスで 16GB GDDR6 メモリを搭載した標準のキャッシュ設計に戻すと、GPU のクロック周波数は急激に低下します。

Infinity Cacheは大量のフレームデータをダイ上に保持することで、Radeon RX 6800のレイテンシを旧世代のRadeon RX 5700 XTと比較して平均34%削減します。シーンがInfinity Cacheに完全に「ヒット」すると、レイテンシはさらに減少します。Naffziger氏によると、AMDのInfinity Fabric通信技術は、効率を最適化するために速度を調整することができ、Infinity Cacheの負荷が特に高くなると最大550GB/秒まで速度が上昇します。さらに、GPUがカードの実際のVRAMにアクセスする必要がある場合でも、Infinity Fabricの全体的な速度向上により、前世代のRadeonカードと比較してレイテンシが改善されています。

AMDは、この最初の3枚のエンスージアスト向けカードのInfinity Cacheを4Kゲーミング向けに最適化しました。そのため、128MBという驚異的な容量が採用されています。Naffziger氏によると、この大容量により、Infinity Cacheは4K解像度で幅広いタイトルにおいて56%の「ヒット率」を達成し、解像度が下がるにつれてさらに高いヒット率を実現しています。AMDのLaura Smith氏によると、これらのカードが1440pゲーミングにおいてNvidiaの競合製品よりも優れたパフォーマンスを発揮する理由の一つは、Infinity Cacheの高いヒット率にあるとのことです。
しかし、Infinity Cacheのパフォーマンスは解像度の低下に比例して向上するわけではないとNaffziger氏は警告する。1080pに解像度を下げると、ゲームはメモリ依存よりもCPUやエンジン依存になることが多い。(将来、より手頃な価格のRadeon RX 6000が発売されれば、このためInfinity Cacheのサイズが縮小される可能性もあるだろう。)
同様に、Infinity Cacheはメモリへの依存度が高いアプリケーションで最もその威力を発揮しますが、ゲームが従来のVRAMに頻繁にアクセスする必要がある場合でも、そのメリットを実感できます。Naffziger氏によると、そのような場合、RDNA 2のメモリシステム全体の動作は、これらのカードに512ビットバスを搭載した場合とほぼ同等になるとのことです。
Infinity Cache はレイ トレーシングにも大いに役立ちます。
RDNA 2によるレイトレーシング
はい、AMDのRadeon GPUはリアルタイムレイトレーシングに対応しています。NVIDIAは、旧型のRTX 20シリーズGPUにレイトレーシング専用の「RTコア」を追加することで、レイトレーシングの幕開けを飾りました。そして今、AMDもRDNA 2の各演算ユニットに専用の「レイアクセラレーター」を1つずつ追加することで、この流れに加わりました。つまり、Radeon RX 6000の上位モデルでは、演算ユニット数が多く、レイトレーシング専用のハードウェアも増えるため、より高性能なグラフィックカードでレイトレーシングが実現できるということです。

Radeon RX 6800と6800 XTのレビューでご覧いただいたように、RDNA 2はNvidiaの第2世代レイトレーシング実装と同等ではありません。それでも驚くほど優れたレイトレーシング性能を発揮し、1440pと1080pの両方の解像度でプレイ可能なフレームレートを実現しています。ただし、高輝度ライティング技術を有効にすると4Kでゲームをプレイすることはできません。AMDはレイトレーシングの目標として1440pゲーミングをターゲットにしていると述べており、概ねその目標は達成されました。
ここでもInfinity Cacheが重要な役割を果たします。レイトレーシングの仕組みについては、この技術が初めて発表されたNVIDIAのTuringアーキテクチャに関する前回の詳細な分析記事で詳しく解説しましたが、基本的には専用のレイトレーシングハードウェアがバウンディングボリューム階層(BVH)トラバーサルと呼ばれる手法を用いて光線の挙動を計算します。このタスクの実行には膨大なメモリが必要になるため、ゲームでレイトレーシングを有効にするとVRAMの要求量が急増します。

Nvidiaのレイトレーシング用BVHアルゴリズム
AMDによると、BVHワーキングセットの「非常に高い割合」をInfinity Cache内に直接保持することで、レイテンシを削減し、全体的なパフォーマンスを向上させることができるとのことです。レイアクセラレータはBVH内の交差を処理し、RDNA 2はレイトランスバーサルと実際のシーンのシェーディングに、コンピュートユニット内の標準シェーダコードを使用します。
とはいえ、AMDはNVIDIAのディープラーニング・スーパーサンプリング(DLSS)技術に対抗できる手段を持っていません。レイトレーシングは非常に計算コストが高く、有効にするとパフォーマンスに著しい影響が出ます。フレームレートの低下を補うため、DLSSはまずゲームを低解像度でレンダリングし、その後、機械学習を用いて最終画像をゲームの解像度に合わせてアップスケールすることで、より鮮明な画像を生成します。この処理はすべて、NVIDIAのAIに特化した専用Tensorコアによって実行されます。
DLSSの初期バージョンは画面にワセリンを塗ったような見た目でしたが、最近のゲームに搭載されているDLSS 2.0テクノロジーはまるで黒魔術のように機能します。これは素晴らしいもので、レイトレーシングをオンにする時の苦痛が本当に軽減されます。また、Tensorコアはレイトレーシングオン時に「ノイズ除去」も処理し、古くて高度でないレイトレーシング実装によく見られるざらざらとした見た目を回避します。

謎の「超解像度」がここに載っています。
AMDは、RDNA 2に専用のAIアップスケーリングハードウェアを搭載していません。ノイズ除去は汎用コンピューティングユニットで処理され、私の目には非常にうまく機能していますが、失われたフレームを取り戻すためのDLSSのような機能はありません。Radeon RX 6000の発表中に、AMDはFidelityFXオープンソースツールスイートの一部として、「Super Resolution」と呼ばれるDLSSのライバルのようなものを詳細には触れずにほのめかしました。担当者は、Super Resolutionがすぐには利用できないことを述べた以外、それ以上のことを語ることを拒否しました。とはいえ、AMDのRDNA 2は両方の次世代コンソールにも搭載されているため、同社はオープンソースの代替手段が実際に登場したときに開発者の間で支持を得ることを期待しています。同社のFidelityFXツールキットには、開発者が実装できるノイズ除去ソリューションも含まれています。
DirectX 12 Ultimateの機能など
しかし、それだけではありません。Nvidiaの最近のRTXブランドGPUと同様に、RDNA 2はDirectX 12 Ultimateに完全準拠しています。MicrosoftはDX12を「ゲーミングエコシステム全体の力の倍増装置」と呼んでおり、一連の新機能(主にNvidiaのTuringベースのRTX 20シリーズで導入されたものの、開発者にはほとんど無視されていた機能)を、最新のPCおよび次世代Xbox Series Xハードウェア全体に統合することで実現しています。

つまり、Radeon RX 6000シリーズのグラフィックスカードは、メッシュシェーディング、可変レートシェーディング、サンプラーフィードバックといった便利な機能も搭載しています。これらについては、DirectX 12 Ultimateの解説記事でご紹介しました。これらの機能はすべて、パフォーマンスとビジュアル忠実度の両方を向上させる大きな可能性を秘めています。AMDは、RDNA 2の様々な部分をこれらの機能に合わせて最適化しました。例えば、カラー圧縮動作の改善や専用のサンプラーフィードバックロジックの追加などが挙げられます。
AMDのRadeon GPUは、2021年にリリースされるMicrosoftのDirectStorage APIもサポートする予定です(NvidiaのRTX 30シリーズも同様です)。DirectStorageを使用すると、NVMe SSDがグラフィックカードのメモリと直接通信できるようになり、読み込みとアセットストリーミングのパフォーマンスが大幅に向上します。DirectStorageがPCでのゲーム読み込み時間を短縮する仕組みをご紹介します。これは、ゲームを根本から変える可能性を秘めています。

RDNA 2の他の側面もアップグレードされました。例えば、ディスプレイエンジンはHDM1 2.1をサポートするようになりました。マルチメディアエンジンは8KビデオのAV1デコードに対応し、NvidiaのAmpere GPUに搭載されている技術に匹敵する高品質8K HEVCエンコードアクセラレータを搭載しています。ただし、8Kは現時点では最もニッチな分野であり、この話はそろそろ長くなりそうです。
これらのRDNA 2の改良点が、実際に購入できるグラフィックカードにどのように反映されているか、Radeon RX 6800とRX 6800 XTの完全レビューをぜひご覧ください。これらのグラフィックカードは素晴らしく、2013年にRadeon R9 290Xが発売されて以来初めて、Nvidiaのハイエンドゲーミングオプションに真に挑戦する存在となっています。2020年について何を語ろうとも、ゲーマーにとって素晴らしい年です。