すべてのコンピューター所有者が、新しいマシンが「週末中」クラッシュすることなく動作したことをアンドリュー・ウィーラー氏ほど喜ぶわけではない。
しかし、すべての人のマシンが「The Machine」であるわけではありません。これは、並列コンピューティングの初期の頃から維持されてきたメモリとプロセッサの関係を再定義する試みです。
ウィーラー氏はヒューレット・パッカード・エンタープライズ(HPE)のバイスプレジデント兼副ラボディレクターです。彼はドイツのハノーバーで開催されるCebit見本市で、HPEのブースに展示されている主要部品「The Machine」について講演しています。
HPE が The Machine で目指すのは、階層化された RAM、フラッシュ、ディスクに囲まれたプロセッサが互いに通信して、どの隣接プロセッサが必要な情報の最新のコピーを持っているかを識別するのではなく、アプリケーション プロセッサが簡単にアクセスできる永続メモリの大規模なプールを構築することです。
「ウォームデータとホットデータはすべて、非常に大規模なインメモリ領域に格納したいと考えています」とウィーラー氏は述べた。「ソフトウェアレベルでは、ストレージへのデータの出し入れを大幅に削減しようとしています。」
こうしたオーバーヘッドを排除することで、ビッグデータ分析や機械学習の分野でますます一般的になりつつある膨大なデータセットの処理が加速されます。
HPE が Cebit で行った The Machine のプレゼンテーションには、ある種の演劇的な雰囲気がありました。
ブース中央の薄暗い部屋では、ガラスケースが上から青い光と揺らめく白い点に照らされている。ガラスケースの中には、メモリ、プロセッサ、光インターコネクトを組み合わせたThe Machineの「ノードボード」が1つ収められている。

ヒューレット・パッカード・エンタープライズは、2017年3月に開催されたCebitトレードショーで、メモリ中心のコンピュータテストベッド「The Machine」のノードボードを展示しました。カメラから最も遠いボードの「前面」には、共有メモリと、メモリファブリックを制御するヒートシンク付きFPGAが搭載されています。中央の別のヒートシンクの下にはプロセッサがあり、その周囲にはメモリが搭載されています。手前にあるのはボードの「背面」で、サーバーラックのバックプレーンへの光インターコネクトを管理するFPGAが搭載されています。
ボードは長いです。実際、少し長すぎます。
ノードボードの設計者は、HPEの高性能サーバー「Apollo」で使用されている21×71センチのサーバートレイをベースに設計したが、ストレージプールにメモリを追加していくうちにスペースが不足してきたため、ボードとトレイを約15センチ拡張したとウィーラー氏は述べた。テストベッドボードは、サーバーラックの前面からその分突き出ている。
ボード前半のメモリモジュール列の間にある4つの大きなヒートシンクは、メモリファブリック(マシン内のすべてのプロセッサがメモリ全体にアクセスできるようにするロジック)を扱うFPGA(フィールド・プログラマブル・ゲート・アレイ)の位置を示しています。ボードの反対側にある他のFPGAは、光インターコネクトを担当しています。ウィーラー氏によると、開発プロセスの後半でFPGAがより小型のASIC(特定用途向け集積回路)に置き換えられると、これらのFPGAはすべて小型化される予定です。
現時点では、メモリ ファブリックの基盤がまだ変化しているため、これらの FPGA は HPE に重要な柔軟性を提供しています。
HPE は、The Machine のメモリ ファブリックの設計で得た教訓を、Intel 独自のメモリ ファブリック テクノロジに代わる技術の開発に取り組んでいる Gen-Z コンソーシアムの他のハードウェア メーカーと共有しました。
「私たちのテストベッドは、Gen-Zの定義された機能をさらに多く組み込むことを可能にします」とウィーラー氏は述べた。仕様が完成すれば、他のGen-Z製品との完全な相互運用性を実現することが目標となる。
Gen-Zは、HPEがThe Machineを初めて起動する約1か月前の昨年10月に設立されました。
それ以来、ウィーラー氏は「最初の立ち上げから現在に至るまで、大規模なシステムで運用してきました」と語った。
どれほど重要なのでしょうか?テストベッドは現在40ノード、メモリプールは160テラバイトです。ちなみに、HPE最大の実稼働サーバーであるSuperdome Xは、最新の128GB DIMMを使用して最大48TBのRAMを搭載できます。
同社は、The Machine のログイン時間に対する需要が非常に高いことを認識しているが、現時点ではそれを満たすことができない。
ただし、メモリ内操作によって大規模なデータセットの処理を高速化できるかどうかを確認したい開発者には、Superdome X を最大限に活用したり、The Machine のハードウェアのシミュレーションでコードを実行したりするなど、他のオプションもあります。
HPE は、The Machine の独特なアーキテクチャを活用できるように Linux オペレーティング システムとその他のソフトウェアを微調整し、その変更をオープン ソース ライセンスの下でリリースしました。これにより、他のユーザーが新しいメモリ ファブリックでアプリケーションのパフォーマンスをシミュレートできるようになりました。
シミュレーションは当然ながら実機よりもはるかに遅くなります。しかし、HPEは「The Machine」の運用経験を積むにつれて、モデルの調整が可能になり、シミュレーションによって予測されるパフォーマンスの向上に自信を深めています。
これらの予測によれば、The Machine は金融ポートフォリオに内在するリスクをモデル化するのに要する時間を、例えばほぼ 2 時間からわずか数秒にまで短縮できるとされており、パフォーマンスは 3 桁向上します。
このスピードなら、週末にたくさんの仕事をこなせるでしょう。