NVIDIAの次世代GPUアーキテクチャがついに登場。NVIDIAのTuringアーキテクチャを搭載したGeForce RTX 20シリーズの発売から約1年半、データセンター向けVolta GPUの発売から3年を経て、CEOのジェンスン・フアンは木曜日の朝、GTC 2020のデジタル基調講演で、新しいAmpereアーキテクチャを搭載したグラフィックスカードを発表しました。まさにモンスター級の性能です。
Ampereは、Nvidiaの新型DGX-A100システムを支える巨大なデータセンターGPU、A100としてデビューします。6,912個のCUDAコアを搭載したこのモンスターは、データサイエンティストをターゲットとしており、内部ハードウェアはディープラーニングタスク向けに最適化されています。サイバーパンク2077をプレイするのには使えないでしょう。
しかし、だからといって、私たちのようなPCゲーマーがAmpereのAI中心の発表から情報を得られないわけではありません。NvidiaのAmpereアーキテクチャが次世代GeForceラインナップにもたらす5つの重要なポイントをご紹介します。
1. Ampereはまだあなたには適していませんが、いずれ適するでしょう
GeForceグラフィックスカードの具体的な詳細をお知りになりたい方は、もう少々お待ちください。VoltaやPascalといった過去のGPUアーキテクチャと同様に、Ampereの壮大な発表は、データセンターのタスクを高速化するために設計された巨大GPUという形で実現しました。しかし、Voltaとは異なり、Ampereはコンシューマー向けグラフィックスカードにも搭載される予定です。
ビジネス記者との事前説明会で、フアン氏はAmpereがNVIDIAのGPUラインナップを簡素化し、データセンター向けVolta GPUとTuringベースのGeForce RTX 20シリーズの両方を置き換えると述べました。ただし、各GPUに搭載されるハードウェアは、ターゲット市場に合わせてカスタマイズされます。Marketwatchによると、コンシューマー向けGPUとワークステーション向けGPUの比較について問われたフアン氏は、「アーキテクチャは大きく重複していますが、構成はそれほど重複していません」と述べました。
2. アンペアが7nmにジャンプ
広く予想されていた通り、NVIDIAのAmpere GPUは、TuringやVoltaで使用されていた12nmプロセスから進歩した7nm製造プロセスで製造されています。これは大きな出来事です。
エヌビディアNvidia が公開したティーザー ビデオによると、A100 の中核を成す Ampere GPU は GA100 と呼ばれています。
トランジスタの小型化は、パフォーマンスと電力効率の向上を意味します。「Navi」ベースのRadeon RX 5000シリーズグラフィックスカードは、NVIDIAに先んじて7nmプロセスを採用し、この移行によりAMD製品の効率が大幅に向上しました。Radeonカードは長年にわたり発熱と消費電力が問題となっていましたが、7nmのNaviカードはパフォーマンスと効率の両方でGeForce製品に匹敵する性能を実現しました。これは決して小さな成果ではありません。Team Green自身の過去を振り返ると、NVIDIAがGeForce GTX 900シリーズの28nmプロセスからGTX 10シリーズの16nmプロセスに移行したことで、パフォーマンスは飛躍的に向上しました。
言い換えれば、歴史は、Ampere ベースの GeForce GPU から素晴らしい進歩が期待できることを示しています。
3. Ampereはより多くのコアを搭載
トランジスタの小型化は、同じスペースにより多くのコアを詰め込めることを意味します。VoltaのフラッグシップモデルであるTesla V100は、815mm²のダイに211億個のトランジスタ、5,120個のCUDAコア、そして80個のストリーミング・マルチプロセッサ・クラスターを搭載していましたが、新しいAmpereベースのA100は、826mm²のダイに540億個のトランジスタ、6,912個のCUDAコア、そして108個のSMを詰め込んでいます。
これは大きな飛躍であり、GPUの搭載量が多いほどグラフィックカードの速度も速くなります。ちなみに、GeForce RTX 2080 Tiは754mm²のダイに4,352個のCUDAコアを搭載しています。後継機は、コア数がさらに膨大になるかもしれません。
4. アンペアのAI脳がさらに賢くなった
VoltaとTuringは、NVIDIAのGPUにTensorコアを導入しました。Tensorコアは機械学習タスクを高速化し、GeForce GPUでは驚異的なディープラーニング・スーパーサンプリング(DLSS)2.0テクノロジーを駆動し、リアルタイム・レイトレーシングのライトキャスティングによって生成される粗いアーティファクトを「ノイズ除去」します。
A100 GPUは第3世代テンソルコアを採用しており、 16ビット「FP16」半精度浮動小数点タスクのパフォーマンスを大幅に向上させ、単精度タスク用の「TF32 for AI」機能を追加し、さらにFP64倍精度タスクもサポートするようになりました。第3世代テンソルコアがAmpereベースのコンシューマー向けGPUにどのように(そして場合によっては導入されるかどうかも)まだわかりませんが、NvidiaがDLSSと機械学習を非常に積極的に推進していることから、特にレイトレーシング性能が大幅に向上するという噂が本当であれば、次世代GeForce GPUが何らかの形でAIをレベルアップすることはほぼ確実でしょう。レイが増えればノイズも増え、ノイズが増えればより優れたノイズ除去が必要になります。
5. AmpereはPCIe 4.0をサポート
NvidiaはDGX-A100システムについては発表していませんが、SupermicroもAmpere A100 GPUを搭載した新システムを発表しており、この発表により、次世代ハードウェアが最先端のPCIe 4.0インターフェースをサポートすることが確認されました。AMDのRyzen 3000シリーズプロセッサは、この新しいインターフェースを最初に採用し、長年コンピューターに搭載されてきたPCIe 3.0スロットと比べて大幅な速度向上を実現しています。
エヌビディアNvidia CEO の Jensen Huang が作り上げたばかりの DGX-A100 Ampere システム。
グラフィックカードに関して言えば、この動きはやや理論的なものに思えるかもしれません。PCIe 4.0をサポートするNaviベースのAMD Radeon 5700グラフィックカードは、PCIe 3.0システムと比べて速度が落ちることはありません。これは当社のPCIe 4.0入門書でも説明されています。また、一般的に、ほとんどのグラフィックカードはPCIe 3.0インターフェースを飽和させるほどには至っていません。
しかし、このトレンド は重要です。TechPowerUpのテストによると、1,200ドルもするGeForce RTX 2080 Tiは、PCIe 3.0 x8スロットではなくPCIe 3.0 x16スロットで動作させた場合、わずかながらも目に見えるパフォーマンス向上が見られました。これは、マルチGPUゲーミングリグにおけるPCIe 3.0の性能の上限に近づいていることを示しています。主流の非HEDTシステムで複数のGPUを動作させる場合、1つのPCIe 3.0 x16接続が2つのスロットに分割されます。
AmpereベースのRTX 2080 Tiの後継機が実際により多くのCUDAコアとはるかに優れたグラフィックス性能を備えている場合、PCIe 3.0 x8接続を圧倒する可能性があります。PCIe 4.0を導入することで、その障害を回避できます。また、システムビルダーにとって新しい展開をもたらします。Intelの最新の第10世代Core CPUは、PCIe 4.0にアップグレードするのではなく、PCIe 3.0を維持することを選択しました。Intel CPUは一般的にゲームではAMD Ryzen CPUよりもわずかに高速に動作しますが、複数のハイエンドAmpere GeForce GPUを内蔵した、強力なシステムを構築する予定であれば、RyzenとそのPCIe 4.0サポートを選択する方が賢明かもしれません。興味深いですね!
[ さらに読む: ゲームに最適な CPU]
私たちがまだ見たいもの
エヌビディアAmpere が登場し、まもなく次世代の GeForce グラフィック カードに搭載される予定です。
NVIDIAによるA100の限定的な発表では、ゲーマーにとって重要な仕様、特にAmpereのクロック速度とレイトレーシング性能が明らかにされませんでした。クロック速度が速いほど、一般的にゲームパフォーマンスも向上します。専用のRTコアを増やすことで、次世代GeForce GPUのレイトレーシング機能が大幅に強化される可能性があります。また、ゲームで美しいライティングエフェクトを有効にした際に現在発生している大幅なパフォーマンス低下も軽減される可能性があります。特にNVIDIAの新しい高度なTensorコアと組み合わせることで、その効果は顕著になります。
残念ながら、GTC 2020の基調講演とNvidiaの関連資料では、どちらの側面にも触れられていませんでした。しかし、最近のリーク情報や噂によると、GeForce Ampere GPUは高速なRTX 20シリーズよりもさらに高いクロック速度を実現し、レイトレーシング速度が最大4倍向上するとのことです。ただし、情報源には正確なリーク情報に関する実績がないため、噂は鵜呑みにしない方が良いでしょう。とはいえ、7nmプロセスへの移行によって得られる余裕は、NvidiaにCUDAコア、RTコア、あるいは(願わくば)その両方を搭載する余裕を与えています。
技術者の方は、Nvidia による Ampere アーキテクチャの詳細な説明をこちらでご覧いただけます。
まとめ:Nvidiaの次世代Ampere GPUアーキテクチャがついに登場。データセンター向けとはいえ、PCゲーマーにとって期待を裏切らない製品です。いよいよAmpereベースのGeForceグラフィックスカードの登場が待ち遠しくなります。Nvidiaはまだこの製品について何も語っていませんが、今年後半には新しいハードウェアが登場すると予想されます。「Big Navi」Radeon GPUや、今後数ヶ月で登場する次世代ゲーム機がAMDハードウェアにさらなるパフォーマンスとレイトレーシングをもたらすことから、Nvidiaはライバルの野望に打撃を与えたいと考えていることは間違いありません。