
Intel の研究者は、最新のクアッドコア Core i7 プロセッサと 2 年前の Nvidia グラフィック カードのパフォーマンスを比較した結果を公開し、Intel プロセッサがグラフィック チップの並列処理パフォーマンスに匹敵できないことを発見しました。
平均すると、2008年6月にリリースされたNvidia GeForce GTX 280は、Intel 3.2GHz Core i7 960プロセッサよりも2.5倍高速で、特定の状況下では14倍以上高速だったと、Intelの研究者は「GPU対CPUの100倍神話の暴露:CPUとGPUのスループットコンピューティングの評価」という論文で報告した。
GPUがIntelプロセッサの100倍の性能を発揮するという主張を覆すため、研究者たちは、14個のスループットコンピューティングカーネルを搭載したクアッドコアCore i7プロセッサとNVIDIA GPUのパフォーマンスを比較しました。この比較は、チップの並列処理能力をテストするために設計されました。
名前が示すように、並列処理では、タスクを順番に処理する必要があるシリアル処理とは対照的に、複数のタスクを同時に処理します。
数十個のコアを持つグラフィックチップは、ポリゴンの描画やテクスチャのマッピングに使用され、コンピュータ画面上にリアルな画像を生成します。これらのコアは並列処理タスクに適していますが、Core i7のように、より少数でより強力なコアを持つプロセッサは、シリアル処理アプリケーションに適しています。これは、Core i7のようなクアッドコアチップが並列処理タスクを処理できないという意味ではありません。Intelの調査で確認されているように、Core i7はGTX280のようなGPUほど優れているわけではないというだけで、並列処理タスクを処理できます。
「テクノロジーの世界では、重要な会議の場で競合企業が立ち上がり、自社の技術は彼らの技術より最大14倍しか速くないと断言するのは稀だ」と、NVIDIAのGPUコンピューティング担当ゼネラルマネージャー、アンディ・キーン氏は同社のブログに書き、インテルの論文へのリンクを提供した。
それでも、キーン氏はインテルが報告したパフォーマンスマージンには感銘を受けなかった。キーン氏は、GPU上で動作するように最適化することでアプリケーションのパフォーマンスが100倍以上向上したNVIDIAの顧客10社を挙げた。インテルによるパフォーマンス比較には、GPUから最高のパフォーマンスを引き出すために必要なソフトウェアの最適化が含まれていなかった可能性が高いとキーン氏は述べ、インテルが比較に使用したソフトウェアコードの詳細を提供していないことを指摘した。
「インテルがベンチマークでこの種の主張をするのを業界が目にするのはこれが初めてではない」と彼は書き、2009年にインテルに対して起こされた米連邦取引委員会の独占禁止法訴訟へのリンクを示した。
この訴訟でFTCは、インテルが報告した以前のベンチマーク結果は「『現実世界』の状況をシミュレートしていないため、一般的なコンピュータの使用法やパフォーマンスの正確または現実的な測定ではなかった」と主張した。
CPUとGPUの正確な性能差に関わらず、グラフィックチップは高性能コンピューティングシステムにおいてますます一般的な機能となりつつあり、中国のNebulaeシステムのような極めて強力なコンピューターもその例外ではありません。現在世界で2番目に高性能なコンピューターであるNebulaeは、XeonサーバーチップとNVIDIA GPUの組み合わせで稼働しています。
シンガポールに拠点を置くサーバーメーカー、ノヴァッテのCEO、ユーリ・ドロズドフ氏は、システムにGPUを追加すると、CPUのみを使用して構築されたシステムに比べて、パフォーマンスが大幅に向上し、コストと消費電力が削減されると述べた。
昨年、ノヴァッテは価格モデルの実行を希望する金融機関の顧客向けにシステムを構築しました。このシステムは100万ドル以上を費やし、60基のIntel Xeonプロセッサと120基のNVIDIA GPUを採用していました。ドロズドフ氏によると、Xeonプロセッサのみで同等の性能を持つシステムを構築した場合、160万ドルの費用がかかり、消費電力はGPUで構築したシステムよりも約28%増加するため、運用コストが高くなるとのことです。
インテル自身も、CPUラインを補完する強力な並列処理チップを製品ラインナップに加えることの重要性を認識しています。5月には、50コアの「Knights Corner」チップの開発を発表しました。同社は、このチップが高性能コンピューティング分野におけるグラフィックチップメーカーとの競争に打ち勝つことを期待しています。ただし、Knights Cornerの発売時期については明らかにしていません。
比較すると、NvidiaのGTX280は240個のプロセッサコアを搭載していますが、同社が最近発表したTesla M20シリーズGPUは448個のコアを搭載しています。(2010年6月24日午後5時30分PDTに訂正)