「Vega を待ちましょう。」過去 6 か月間、これが Radeon の信奉者からのメッセージでした。Nvidia の強力な GeForce GTX 1070 と GTX 1080 が AMD の Radeon RX 400 シリーズ グラフィック カードを圧倒してきたからです。
Nvidiaの強力な新16nm Pascal GPUアーキテクチャは、120ドルの低価格GTX 1050から1,200ドルの高価格GTX Titan Xまで幅広く対応していますが、AMDの14nm Polarisグラフィックスはより主流のビデオカード向けに設計されており、フラッグシップのRadeon RX 480はNvidiaのハイエンドの格闘ゲームには太刀打ちできません。そのため、「Vegaを待て」というスローガンは、顔が溶けるようなゲームプレイを求めるAMD支持者の間で合言葉となっています。Vegaとは、2017年初頭のAMDロードマップで予告されていた、エンスージアスト向けの新14nm Radeonグラフィックスアーキテクチャのコードネームです。
こちらは、PCWorld の Brad Chacos 氏と Gordon Ung 氏が CES 2017 で Radeon の責任者 Raja Koduri 氏と 40 分以上にわたって Vega と FreeSync 2 について話しているビデオです。
残念ながら、新しいアーキテクチャが出荷カードに搭載されるのは 2017 年前半の後半になる予定なので、待ち時間は続きます。しかし、CES では、Vega は単なるコードネーム以上の存在になりつつあります。AMD はついに、新しい GPU がグラフィックス パフォーマンスとメモリ アーキテクチャを根本的に新しい方法で組み合わせる方法など、Nvidia の巨人たちに対するパフォーマンス重視の Radeon の技術的なヒントをいくつか公開しました。
詳しく説明する前に、Vega テクニカル アーキテクチャ プレビューの概要を説明します。

AMD の Radeon Vega グラフィックス アーキテクチャのテクニカル プレビュー。
これらすべての言葉は、時が経てば意味を持つようになります。まずは、あなたが聞きたいことから始めましょう。
1. すごい、速い
真剣に。
12月にジャーナリストとアナリストに公開されたプレビューで、AMDは2016年の傑作『Doom』を、初期のRadeon Vega 10グラフィックカードで、全てをUltraモード(4K解像度)でプレイしました。Doomはスケール感は抜群ですが、どのグラフィックカードにとっても地獄のようなパフォーマンスです。Techspotによると、GTX 1080でさえ、この設定では平均60fps(フレームレート)に達することができません。一方、Radeon Vegaは60fpsから70fpsの間を推移しました。もちろん、Radeon VegaはDirectX 11ではなく、 DoomでRadeonカードを優先するグラフィックAPIであるVulkanを使用していましたが、それでもデモは実に印象的でした。
ここ数週間で、Vegaの速度を裏付ける目撃情報がいくつかありました。AMDのRyzen CPUを世界に発表したNew Horizonのライブストリームでは、 RyzenとVegaを組み合わせたPCで『Star Wars: Battlefront』を動作させる様子が披露されました。この2台は、4Kモニターの60Hzの速度を最大限に引き出し、すべての設定をUltraモードに設定しました。一方、Techspotのテストによると、GTX 1080は50fpsをわずかに下回るフレームレートでした。
一方、12月初旬にAshes of the Singularityデータベースでリークされた情報(現在は削除されています)では、デバイスID「687F:C1」のGPUがベンチマーク結果で多くのGTX 1080を上回ったことが示されていました。ここで驚くべき事実があります。AMDが最近DoomとVegaをプレビューした際に、フレームレートオーバーレイに表示されたデバイスIDから、Vega 10が実際に687F:C1であることが確認されたのです。
これらの数字にはさまざまな注意事項が付いています。Vega 10 はまだ最終版ではありません。AMD が予告したグラフィック カードが Vega の最も強力なバージョンであるかどうかはわかりません。ベンチマークされた 3 つのゲームはすべて Radeon に大きく有利です。などです。
とはいえ、Vegaはグラフィックス性能の面で確かに競争力があるように見える。これはAMDがVegaを、単にハードに処理するだけでなく、よりスマートに動作するように設計したためでもある。グラフィックスと並列コンピューティングアーキテクチャに注力するAMDコーポレートフェロー、マイク・マンター氏によると、「適切なデータを適切なタイミングで移動し、適切な方法で処理すること」がチームの主要目標だったという。そして、その大きな目的は、グラフィックス処理とVegaの革新的なメモリ設計をより密接に結び付けることにあるという。
2. 記憶について
オンボード メモリに関して言えば、Vega は前モデルと同様に、まさに革命的です。
AMDの現行ハイエンドグラフィックカード、Radeon Furyシリーズは、最先端の高帯域幅メモリを世界にもたらした。Vegaは、AMDが新たに導入した「高帯域幅キャッシュコントローラー」を搭載し、改良された次世代HBM2でその伝統を引き継いでいる。
技術的な制限により、第一世代のHBMはわずか4GBの容量に制限され、FuryシリーズのオンボードRAMも4GBに制限されていました。幸いなことに、HBMの純粋な速度はほとんどのゲームでこの欠点を隠していましたが、HBM2ではその制約が払拭されました。AMDはVegaの容量を公式に発表していませんが、Doomのデモ中のオーバーレイで、このグラフィックカードが8GBのRAMを搭載していることが明らかになりました。そして、この超高速RAMはさらに高速化しており、AMDのジョー・マクリ氏は、HBM2はHBM1のピンあたりの帯域幅が2倍になると述べています。

Vega の高帯域幅キャッシュとキャッシュ コントローラは、メモリの潜在能力の無限の世界を実現します。
しかし、結局のところ、HBMはほんの始まりに過ぎませんでした。「これは進化する技術であり、時間をかけて進化させ、より大きく、より高速に、そしてあらゆる重要な改善を加えることができます」と、HBM開発の原動力となったマクリ氏は述べています。VegaはHBMをベースに、新しい高帯域幅キャッシュと高帯域幅キャッシュコントローラーを導入しました。これらを組み合わせることで、Radeonの責任者であるラジャ・コドゥリ氏が「世界で最もスケーラブルなGPUメモリアーキテクチャ」と呼ぶものが実現します。
AMDは、グラフィックス性能が飛躍的に向上する一方で、メモリ容量と性能が比較的停滞している世界において、メモリ設計を飛躍的に進化させるために、Vegaの高帯域幅メモリアーキテクチャを開発しました。HBキャッシュは、グラフィックスカードの従来のフレームバッファに代わるものです。HBキャッシュコントローラは、きめ細かなデータ制御を提供し、512テラバイト(ギガバイトではなくテラバイト)という驚異的な仮想アドレス空間をサポートします。VegaのHBM設計は、グラフィックスメモリをオンボードRAMを超えて、複数のメモリソースを同時に管理できる、より異種混合のメモリシステムへと拡張できます。

これは、新しいRadeon Instinctシリーズや、大容量NANDメモリをグラフィックプロセッサに直接搭載した最先端のRadeon Pro SSGカードといったプロフェッショナル向けアプリケーションに最も大きな影響を与えると思われます。「これにより、テラバイト単位のメモリをGPUに接続できるようになります」と、AMDのインダストリーアライアンス責任者であるDavid Watters氏は、Radeon Pro SSGの発表時にPCWorldに語りました。HBMの超高速処理向けに設計されたこの新しいキャッシュおよびコントローラアーキテクチャは、これらの性能をさらに向上させるはずです。
AMDは、その潜在的なメリットを分かりやすく伝えるため、マクリ大統領の自宅リビングルームをフォトリアリスティックに再現した映像を公開しました。600GBのシーンは通常、レンダリングに数時間かかりますが、Vegaの優れた性能と新しいHBM2アーキテクチャを組み合わせることで、わずか数分でレンダリングできます。さらに、AMDはジャーナリストがカメラをリアルタイムで部屋中移動させることも許可しました(ただし、多少動作は遅い)。まさに目を見張るデモでした。

コドゥリ氏は、高帯域幅キャッシュコントローラのきめ細かな動的データ管理はゲームにもメリットをもたらすと強調し、ウィッチャー3とFallout 4を例に挙げました。これらのゲームは4K解像度で動作している際に、実際に割り当てられたメモリの半分以下しか使用していません。「しかも、これらは十分に最適化されたゲームです!」と彼は言いました。注目度の高いゲームではメモリ需要がますます高まっており、最先端の解像度ではその傾向がさらに強まっています。HBキャッシュのきめ細かな制御とHBMの圧倒的なスピード、そしてこの記事で後述するその他の調整を組み合わせることで、この負担がいくらか軽減されることを期待しています。
AMDはまた、将来の世代のゲームでは、今日のようにより直接的なアプローチで処理するのではなく、高帯域幅のメモリ設計を利用して、大規模なデータセットをグラフィックプロセッサに直接アップロードできるようになるとも述べています。
3. 効率的なパイプライン管理
グラフィックカードによるゲームのレンダリング方法は、あまり効率的ではありません。例えば、下の『Deus Ex: Mankind Divided』のシーンがそうです。Koduri氏によると、このシーンには2億2000万ものポリゴンが詰め込まれていますが、実際にプレイヤーに見えるのはそのうち200万程度に過ぎません。そこで、Vegaの新しいプログラマブルジオメトリパイプラインが登場します。


シーンのレンダリングは複数のステップから成るプロセスで、グラフィックカードは頂点シェーダーを処理してから、その情報をジオメトリエンジンに渡して追加の処理を行います。Vegaはプリミティブシェーダーを活用して処理を高速化します。プリミティブシェーダーはプレイヤーから見えないポリゴンを素早く識別し、ジオメトリエンジンがそれらのポリゴンに時間を浪費するのを防ぎます。まさに効率の良さです!
Vega は、前世代機の 2 倍以上のピーク スループットで情報を高速処理し、パイプラインの最初からタスクの負荷分散を改善する新しい「インテリジェント ワークグループ ディストリビューター」を搭載しています。

Vega のプリミティブ シェーダー。
これらの調整は、AMDのコンソールへの浸透がPCゲーマーにもメリットをもたらすことを如実に示しています。負荷分散調整の着想は、PC開発者よりも「ハードウェアに近い」作業に慣れているコンソール開発者から生まれたもので、彼らはこれをAMDにとって改善の余地があると指摘したと、ラジャ・コドゥリ氏は述べています。
4. 適切なタスク、適切なタイミング
AMDのマイク・マンター氏によると、Vegaは「実行する必要のない作業をスマートにスケジュールする」ように設計されているという。同社が公開した最後の情報は、そのことを裏付けている。
Vegaは、AMDが長年に渡りメモリ帯域幅の消費量削減に取り組んできた取り組み(Nvidiaもこの取り組みに着手している)の延長線上にある。次世代ピクセルエンジンには「ドローストリームビニングラスタライザー」が搭載されており、高帯域幅キャッシュコントローラーと連携することでシーン処理を効率化し、パフォーマンス向上と省電力化を実現する。ジオメトリエンジンが(既に削減された)処理を完了した後、Vegaはユーザーには見えない、つまりレンダリングの必要がない重複ピクセルを特定する。GPUはこれらのピクセルをレンダリングに時間を浪費するのではなく、破棄する。マンター氏によると、ドローストリームビニングラスタライザーの設計は「レンダリングするピクセルを一度だけアクセスできるようにする」という。

頭がいい!
刷新されたVegaアーキテクチャでは、ピクセルエンジンからのレンダリングバックエンドを、メモリコントローラに直接送るのではなく、より大容量の共有L2キャッシュに送るようになりました。AMDによると、これにより、遅延シェーディングを利用するGPUコンピューティングアプリケーションのパフォーマンスが向上するとのことです。(このトピックに関する詳細な概要については、L1キャッシュとL2キャッシュの仕組みに関するExtremeTechの記事をご覧ください。)
5. 次世代コンピューティングエンジン

最後に、AMDはVegaの「次世代コンピューティングエンジン」について紹介しました。このエンジンは、1クロックあたり512回の8ビット演算、1クロックあたり256回の16ビット演算、または1クロックあたり128回の32ビット演算が可能です。8ビット演算と16ビット演算は主に機械学習、コンピュータービジョン、その他のGPUコンピューティングタスクで重要ですが、Koduri氏によると、16ビット演算はそれほど厳密な精度を必要としない特定のゲームタスクにも役立つ可能性があるとのことです。(AMD搭載のPlayStation 4 Proも、1クロックあたり256回の16ビット演算をサポートしています。)

Vega の新しいコンピューティング ユニットは、2 つの 16 ビット操作を同時に実行できます。
偶然にも、Vega NCUは2つの16ビット演算を同時に実行でき、2倍に増やして一緒にスケジュールすることができます。これは以前のAMD GPUでは不可能だったとKoduri氏は言います。Vegaの次世代コンピューティングユニットは、GPUのより高いクロック速度と高い命令サイクル数に合わせて最適化されていますが、AMDはVegaのコアクロック速度をまだ公表していません。
ベガを待つ
Vegaの発売はまだまだ先ですが、Radeon Technologies Groupが秘めた切り札がついに明らかになりました。これらの技術的な情報は、グラフィック愛好家の興味をそそるには十分なものの、コンシューマー向けVegaグラフィックカードに関する確かな情報は、残念ながらほとんど公開されていません。(AMDはNVIDIAに手の内を見せたくないようですが。)AMDが、ゲームとプロフェッショナルの両方でVegaの効率と可能性を高めるために、巧妙な新技術を試みていることは明らかです。今後数ヶ月のうちに、具体的な詳細が少しずつ明らかになるでしょう。
しかし、Vegaの登場が遅かれ早かれ訪れることを祈るばかりです。AMDはCES 2016で14nm Polaris GPUアーキテクチャを予告しましたが、Radeon RX 480の発売は6月末まで待たなければなりませんでした。Vegaの発売時期は2017年前半とされていたため、AMDがE3までこの新世代のエンスージアスト向けグラフィックカードの発売を待つとすれば、Nvidiaの強力なGTX 1080は既に1年も市場に出回っていることになります。
Vega は非常に魅力的に見えますが、最も熱心な Radeon ファンでも、新しい PC を構築するのにそれほど長く待つことはできません。特に、AMD の話題の Ryzen プロセッサが間もなく発売されることを考えればなおさらです。