「NVIDIAにはルールがあります。どんなプロジェクトも3つの奇跡に頼ってはならない、というものです」と、CEOのジェンスン・フアン氏は、火曜日にカリフォルニア州サンノゼで開催されたGTCカンファレンスでステージを歩きながら述べた。「テスラP100には5つの奇跡があるのです。」
実際、NVIDIAのハイパースケールデータセンター向け新型グラフィックモジュールは、同社の現世代Maxwell GPUの2倍以上のトランジスタを搭載しており、まさに天国のような存在と言えるでしょう。GTCでコンシューマー向けグラフィックカードに関する発表がなかったのは少々残念でしたが、大型Pascalグラフィックスを搭載した最初の製品はあまりにも素晴らしく、その期待は瞬く間に払拭されました。
Tesla P100には、グラフィックプロセッサが4年間も28nmノードで停滞していた16nm FinFETトランジスタから、第2世代の高帯域幅メモリ(HBM)テクノロジー、NVIDIA独自のPascal GPUアーキテクチャ、そしてNVIDIAの超高速NVLinkインターコネクトテクノロジーまで、数々の最先端テクノロジーが搭載されています。これらの機能は4つの奇跡を構成し、5つ目の奇跡である高度なAI学習アルゴリズムを支えています。
「これには非常に多くの新しい技術が必要でした」と黄氏は顔を輝かせて語った。

NVIDIAが2年前から予告してきたTesla P100の中核を成すPascal GPUは、長らく遅れていた16nmトランジスタ技術への移行を活用し、600ミリメートル四方のチップに150億個ものトランジスタを詰め込んでいる。「今持ち上げたら、後ろの列からでも見えるでしょう」とHuang氏は冗談めかして言った。
これはMaxwellの70億個のトランジスタの2倍以上であり、Tesla P100は倍精度浮動小数点演算で5.3テラフロップス、単精度浮動小数点演算で10.6テラフロップスを実現します。一方、Titan Xは単精度浮動小数点演算で7テラフロップスです。
最新情報:基調講演終了後、NVIDIAはPascal GPUアーキテクチャの完全な情報(速度、フィード、ブロック図を含む)を公開しました。詳細については、PCWorldのPascal GPU技術詳細をご覧ください。
600mmのダイサイズ(これがダイサイズであり、他の部品を含まないと仮定)は偶然ではない可能性が高い。AMDのハイエンドFijiチップは596mm平方である。Tesla P100は、Radeon Fury Xで初めて採用された16GBの超高速第2世代HBMメモリを搭載することで、Fijiの戦略を踏襲している。ハイエンドのNvidia Maxwell GPUは384本の配線バスを介してメモリに接続するが、Huang氏によると、Tesla P100のメモリとGPUはなんと4,000本の配線を介して通信する。全体として、このモジュールには合計150億以上のトランジスタが搭載されている。これは驚異的だ。

しかし、新技術はそれだけではありません!Tesla P100は、NVIDIAの新しいNVLink相互接続テクノロジーを搭載しており、グラフィックモジュール同士、そしてCPU間の通信において、標準的なPCIe接続の5倍の双方向通信速度を実現します。さらに、PCIeの4つではなく最大8つのGPU接続をサポートし、より多くのGPUをグラフィックコンピューティングに活用できるようになります。
昨年、Huang氏はPascalグラフィックスを搭載したシステムはMaxwellベースのシステムよりも10倍高速になると予告した。しかし、現実はさらに高水準だったとHuang氏は語る。NVLink、Pascalの最適化、HBM2、そしてチップ上のトランジスタ数を考慮すると、実際には12倍の速度向上が見られるとHuang氏は述べ、Maxwell PCでは25時間かかるワークロードがPascalシステムではわずか2時間で完了する例を挙げた。

まさに奇跡です。Nvidia Tesla P100は現在量産中で、HBMの制約により、2017年第1四半期にはサーバー製品に搭載される予定です。
今後数ヶ月のうちに、魅力的な最新GPU技術がコンシューマー向けグラフィックカードにも搭載されるようになると期待されます。その最初の一端は、スマートカー向けNVIDIA Drive PX2ボードで垣間見られるかもしれません。このボードには、Huang氏によると未発表のGPUが2基搭載されていました。

これは、一般向けグラフィックカードに搭載される可能性のある、より控えめなPascal GPUチップの初公開と言えるでしょうか?いずれにせよ、このグラフィックチップをざっと見てみると(画像をクリックすると拡大します)、HBMモジュールではなく、従来のメモリチップに囲まれていることがわかります。つまり、すべてのPascal搭載GPUがGDDR5 RAMを廃止するわけではないということです。ヒント、ヒントです。