インテルはついに、AVX-512 命令セットの「苦痛に満ちた死」を望むほどの批評家たちからその命令セットを擁護した。
インテルのチーフアーキテクトであるラジャ・コドゥリ氏は、コミュニティーがこの技術を気に入っているのはパフォーマンスの大幅な向上が見込めるためであり、インテルにはポートフォリオ全体にわたってこれを提供する義務があると語った。
「AVX-512は素晴らしい機能です。HPCコミュニティやAIコミュニティの皆さんも大変気に入っています」と、8月11日に開催されたIntelのArchitecture Dayで、PCWorldからのAVX-512騒動に関する質問に対し、コドゥリ氏は答えました。「データセンター側のお客様も、本当に、本当に、本当に気に入っています。」
コドゥリ氏は、インテルは、この拡張機能を利用するだけで、顧客が「古き良きCPUソケット」で285倍のパフォーマンス向上を実現できるよう支援することができたと述べた。
インテルIntelは、AVX-512により顧客のパフォーマンスが飛躍的に向上したと述べた。
AVX-512を好んでいない人物の一人が、Linuxの生みの親であるリーナス・トーバルズ氏です。トーバルズ氏はReal World Technologiesのフォーラム投稿(彼自身も頻繁に参加しています)で、IntelのXeon CPUや、Core i7-1065G7などの第10世代「Ice Lake」ノートPC向けCPUに搭載されている命令セットについて率直に語っています。
「AVX-512が苦痛に満ちた死を迎え、インテルが魔法のような命令をでっち上げてベンチマークを作ろうとするのではなく、真の問題の解決に着手してくれることを願っています」とトーバルズ氏は書いている。「インテルには原点に立ち返り、プロセスを再び機能させ、HPCやその他の無意味な特殊ケースではない、通常のコードにもっと注力してほしいと思います。」
トーバルズ氏は、デスクトップにおけるAVX-512の問題点として、パフォーマンスの低下を挙げた。例えば、Intelの初代Skylake-Xシリーズでは、AVX-512を使用する際にはCPUクロック速度を低下させざるを得なかった。
「私は、最高周波数を奪い(結局は memcpy に使われるようになったため)、コアを奪う(役に立たないガベージユニットがスペースを占有するため)AVX-512 パワーウイルスではなく、通常の整数コードで電力の限界に到達したいのです」と Torvalds 氏は書いている。
AVX-512を批判したのはトーバルズ氏だけではありませんでした。元インテルエンジニアのフランソワ・ピエノエル氏も、この特殊命令はノートパソコンには不向きだと述べています。消費電力とダイスペースのトレードオフが割に合わないからです。
インテルIntel は、AVX-512 を使用することで、データセンター AI 顧客にとって大きな進歩を遂げたと主張しています。
インテルのAVX-512は幅広いエコシステムを実現します
コドゥリ氏は、憎悪は理解できるが、インテルもコミュニティに対して義務を負っていると述べた。
「CPUコアは私たちの宝物です」とコドゥリ氏は述べた。「CPUコアに命令を追加すると、歴史的にx86の強みと当社の命令セット拡張は、あらゆる場所で利用できるようにしてきたのです。そのため、Sunny CoveのようなIPがIce LakeサーバーのようなサーバーとIce Lakeクライアントのようなクライアントの両方で利用できるようになると、命令セットの共通性が得られるのです。」
コドゥリ氏も、トーバルズ氏の批判には一理あると認めた。「ある角度から見れば、リーナス氏の『このベクタービットを活用するクライアントアプリケーションはまだあるのだろうか?』という批判は、もっともなことかもしれない」と彼は述べた。コドゥリ氏はさらに、インテルはサーバーからラップトップに至るまで、ハードウェアとソフトウェアの契約を維持しなければならないと説明した。それがエコシステムの魔法だからだ。
「(それが)x86エコシステムの素晴らしいところです。ノートパソコン用のソフトウェアを書いて、それをクラウドでも動かすことができるのです」とコドリ氏は述べた。「それがx86エコシステムの強みなのです。」
Koduri 氏のコメントは、Intel の機械学習パフォーマンス担当ゼネラルマネージャーである D. Wei Li 氏の同様のコメントと一致しており、同氏は AI とディープラーニング向けの CPU は理にかなっていると述べています。
「なぜCPUなのか?CPUはどこにでもあり、汎用性も高い」とLi氏は述べた。「データセンターにはXeonが多数搭載されている。ノートパソコンにはCPUが搭載されている。CPUをAIに活用できれば、誰もがその恩恵を受けることができる。」
AVX-512や特殊命令をいくら批判しても、Intelは方向転換するつもりはありません。コドゥリ氏は、今後もAVX-512をはじめとする特殊命令に依存し続けると述べました。
「我々は Linus 氏の懸念を理解していますし、周波数などに影響を及ぼした第 1 世代の AVX-512 の問題のいくつかも理解しています」と同氏は述べ、「そして我々は世代ごとにそれをさらに改善しています」と続けた。
実際、パフォーマンス重視のソフトウェアブロガーであるTravis Downs氏は、Core i5-1035G4のテスト結果から、AVX-512はラップトップにほとんどペナルティを課さないことが示されたと述べています。Downs氏のテストでは、アクティブコアを1つ使用した場合、AVX-512でクロック速度がわずか100MHzしか低下しないことが分かりました。
「少なくとも、AVX-512命令の周波数関連コストに関するメンタルモデルを修正する必要があることを意味します」とダウンズ氏は結論付けた。「『一般的に大幅なダウンクロックを引き起こす』というよりは、このIce Lakeチップでは、AVX-512はライセンスベースのダウンクロックをほとんど、あるいは全く引き起こさないと言えるでしょう。これは他のIce Lakeクライアントチップでも当てはまると期待しています。」彼の調査結果にはより微妙なニュアンスがありますが、一読の価値はあります。