Latest evidence-based health information
Apps

Nvidiaが次世代Fermiアーキテクチャを発表

Nvidiaが次世代Fermiアーキテクチャを発表
Nvidiaが次世代Fermiアーキテクチャを発表

NvidiaはNVISIONプロモーションカンファレンスを「GPUテクノロジーカンファレンス」に改名しましたが、それでもなお、完全にNvidiaのショーです。CEOのジェンスン・フアン氏は基調講演の中で、同社の次期主要GPUアーキテクチャ(コードネーム「Fermi」)を発表しました。これは、グラフィックスファンがGT300と呼んでいるチップで、GeForce GTX 285などのグラフィックスカードに搭載されているGT200チップの後継世代です。

チップ大手のNVIDIAは、このチップを新しいグラフィックチップではなく、新しい「コンピューティング&グラフィックス」チップとして位置付けることに非常に慎重でした(強調は筆者)。実際、この新しいチップについて明らかにされたほぼすべては、テクスチャユニットやレンダリングバックエンドといった従来のグラフィック指向の要素ではなく、そのコンピューティング機能に関するものです。わかっているのは、このチップが推定30億個のトランジスタを搭載する巨大チップであり、TSMCの40nmプロセスで製造されるということです。これは、ライバルのAMDが先日リリースしたばかりの新しいRadeon 5800シリーズDirectX 11カードに搭載されているRV870チップよりも約40%多いトランジスタ数です。このチップには512個のプロセッシングユニット(NVIDIAはCUDAコアと呼んでいます)があり、それぞれ32個のコアを持つ16個の「ストリーミングマルチプロセッサ」に編成されています。これはGT200の240個のコアの2倍以上であり、コアには大幅な機能強化が施されています。このチップは384ビットGDDR5メモリインターフェースを使用します。

主な要点は次のとおりです。

第 3 世代ストリーミング マルチプロセッサ (SM)

  • SMあたり32個のCUDAコア(GT200の4倍)
  • GT200 の 8 倍のピーク倍精度浮動小数点パフォーマンス
  • 32 スレッドの 2 つのワープをスケジュールしてディスパッチするデュアル ワープ スケジューラ
  • 1クロックあたり
  • 共有メモリと L1 キャッシュのパーティションを構成可能な 64 KB の RAM

第 2 世代並列スレッド実行 ISA

  • 完全な C++ サポートを備えた統合アドレス空間
  • OpenCLとDirectCompute向けに最適化
  • 完全なIEEE 754-2008 32ビットおよび64ビット精度
  • 64 ビット拡張を備えた完全な 32 ビット整数パス
  • 64ビットアドレッシングへの移行をサポートするメモリアクセス命令
  • 予測によるパフォーマンスの向上

メモリサブシステムの改善

  • 設定可能な L1 と統合 L2 を備えた NVIDIA Parallel DataCache 階層
  • キャッシュ
  • ECCメモリをサポートする初のGPU
  • 原子メモリ操作性能が大幅に向上

NVIDIA ギガスレッドエンジン

  • アプリケーションコンテキストの切り替えが10倍高速化
  • カーネルの同時実行
  • 順序外スレッドブロック実行
  • デュアルオーバーラップメモリ​​転送エンジン

このチップには、ストリームコンピューティングタスクにおけるパフォーマンスを向上させる多くの追加機能が搭載されています。例えば、倍精度浮動小数点演算速度の大幅な向上などが挙げられます。現在のNvidia GPUは、倍精度浮動小数点演算を単精度演算の数分の1の速度で実行します。倍精度浮動小数点演算は単精度の半分の速度になり、これは大きな改善です。キャッシュとスケジューリングにも大きな改善が見られます。アーキテクチャの詳細については、Nvidiaの新しいFermiページをご覧ください。PDFのホワイトペーパーも掲載されています。

では、このチップを採用したグラフィック カードはいつ購入できるようになるのでしょうか。Nvidia は何も明言していません。同社担当者は現在「チップを強化中」と述べており、これは動作可能なサンプルが製造工場から最近戻ってきたばかりだということです。過去の履歴から推測すると、発売日としては楽観的に考えて 12 月、広く入手可能になるのは 2010 年第 1 四半期になる可能性が高いでしょう。ボードは高価になることが予想されます。Nvidia はチップ サイズを明かしていませんが、トランジスタ数から判断して 450 ~ 500 mm 2の間ではないかと推測します。384 ビットのメモリ インターフェイスの追加ボード コストや、比較的新しい 40nm 製造プロセスでこのような巨大なチップから良好な歩留まりを得るための課題を考慮すると、リリースされたばかりの AMD の Radeon 5800 シリーズ カードよりも強力で高価なカードになる可能性があります。

Twitter で Jason Cross をフォローするか、彼のブログにアクセスしてください。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.