Latest evidence-based health information
Vision

次はエクサスケールコンピュータ、2020年までに登場予定

次はエクサスケールコンピュータ、2020年までに登場予定
次はエクサスケールコンピュータ、2020年までに登場予定

スーパーコンピュータの速度向上が現在のペースで続けば、2020年までに初のエクサスケールマシンが登場すると、世界最速システムをまとめたTop500の管理者らは予測している。

しかし、このような大型コンピュータのシステム設計者は、いくつかの重大な問題に直面することになるだろうと、リスト管理者は警告している。

「このマシンを届けるには相当な困難が伴うだろう」と、テネシー大学ノックスビル校の研究者で、Top500の立役者の一人であるジャック・ドンガラ氏は述べた。ドンガラ氏は、今週ソルトレイクシティで開催されているSC2012カンファレンスで、先週発表された最新版のリストに関するプレゼンテーションを行った。

エクサスケールの性能が実現するまでには、まだ道のりは長い。エクサスケールマシンは、1京FLOPS(1秒あたりの浮動小数点演算回数)、つまり10の18乗FLOPSの性能を持つ。しかし、現在最速のスーパーコンピュータでさえ、エクサスケールマシンの性能の20%にも満たない。

スーパーコンピュータの性能向上予測トップ500

新たな高み

月曜日に発表された最新版のスーパーコンピュータTop500リストで、最速のコンピュータはオークリッジ国立研究所のTitanシステムで、17.59ペタフロップスの処理能力を誇りました。1ペタフロップスは1秒間に1000兆回の浮動小数点演算、つまり10の15乗FLOPSに相当します。

しかし、年に2回発表されるTop500ランキングは、スーパーコンピュータの速度がいかに急速に向上しているかを示しています。このランキングから判断すると、スーパーコンピュータは約10年ごとに10倍の性能向上を見せているようです。1996年には初めてテラフロップスのコンピュータがTop500に登場し、2008年には初めてペタフロップスのコンピュータがトップ500に登場しました。この進歩の速度から推計すると、ドンガラ氏はエクサスケールコンピューティングが2020年頃に到来すると予測しています。

高性能コンピューティング(HPC)コミュニティは、エクサスケール・コンピューティングを大きなマイルストーンと捉えています。インテルは、Phiと呼ばれる超マルチコア・プロセッサのラインを開発しました。同社は、このプロセッサが2018年までに稼働するエクサスケール・コンピュータの基盤となることを期待しています。

ドンガラ氏は講演の中で、エクサスケールマシンの特徴を概説した。このようなマシンは、10万から100万ノード程度で構成され、最大10億スレッドを常時実行できるようになる。個々のノードの性能は1.5テラフロップスから15テラフロップス、インターコネクトは毎秒200ギガバイトから400ギガバイトのスループットが必要となる。

ドンガラ氏は、スーパーコンピューターメーカーは、購入と運用コストが高騰しすぎないように、コストと消費電力が性能に比例して増加しないようにマシンを構築する必要があると述べた。エクサスケールマシンは約2億ドルのコストで、消費電力は約20メガワット、つまり1ワットあたり約50ギガフロップスに抑えられるはずだ。

ドンガラ氏は、このようなコンピュータの製造コストの半分は、システム用メモリの購入に充てられると予想している。メモリメーカーのロードマップから判断すると、ドンガラ氏は2020年までに1億ドルで32ペタバイトから64ペタバイトのメモリが購入されると見積もっている。

スーパーコンピュータの年間性能向上トップ500

ソフトウェアの課題

エクサスケール・スーパーコンピュータの設計者は、ハードウェアの課題に加えて、ソフトウェアの問題にも取り組まなければなりません。ドンガラ氏によると、その一つは同期です。今日のマシンは多くの異なるノード間でタスクを渡しますが、ノード数が増えるにつれて、このアプローチを合理化する必要があります。

「現在、並列処理のモデルはフォーク/ジョインモデルですが、エクサスケールレベルの並列処理ではそうはいきません。モデルを変える必要があります。より同期性を高める必要があります」とドンガラ氏は述べた。同様に、ノード間の通信量全体を削減するアルゴリズムの開発も必要だ。

他の要素も考慮する必要があります。ソフトウェアには最適化のためのルーチンが組み込まれている必要があります。「ソフトウェアをピークパフォーマンスに近い状態で動作させるために、ユーザーが適切なノブやダイヤルを設定することだけに頼ることはできません」とドンガラ氏は述べています。耐障害性も重要な機能の一つであり、結果の再現性、つまり複雑な計算を複数回実行しても全く同じ結果になることを保証することも重要です。

再現性はコンピューターにとって当然の特性のように思えるかもしれません。しかし実際には、マルチノード・スーパーコンピューターにおける大規模計算では、再現性が課題となる場合があります。

「数値計算手法の観点から言えば、ビット単位の再現性を保証するのは難しい」とドンガラ氏は述べた。「主な問題は、縮約、つまり並列に数値を合計することにあります。数値が加算される順序を保証できないと、丸め誤差が異なってしまいます。その小さな差が拡大され、結果が破滅的に乖離してしまう可能性があります」と彼は述べた。

「これらの操作が行われる順序を保証し、同じ結果が得られることを保証できるシナリオを考え出す必要があります」とドンガラ氏は語った。

ジョアブ・ジャクソンは、IDGニュースサービスでエンタープライズソフトウェアとテクノロジー全般の最新ニュースを担当しています。Twitterで@Joab_Jacksonをフォローしてください。ジョアブのメールアドレスは[email protected]です。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.