Latest evidence-based health information
Iphone

Facebook、強化された人工知能サーバー「Big Sur」の設計図を公開

Facebook、強化された人工知能サーバー「Big Sur」の設計図を公開
Facebook、強化された人工知能サーバー「Big Sur」の設計図を公開

Facebook は、人工知能ソフトウェアのトレーニングに使用するサーバーのハードウェア設計を公開し、AI を研究している他の企業が同様のシステムを構築できるようにしています。

Facebookは、コードネーム「Big Sur」と呼ばれるこのサーバーを、機械学習プログラムの実行に利用しています。機械学習プログラムは、時間の経過とともに「学習」し、タスクの精度を向上させるAIソフトウェアの一種です。Facebookは、企業が新しいハードウェアの設計を共有できるように設立したOpen Compute ProjectにBig Surを提供しています。

機械学習の一般的な用途の一つは画像認識です。画像認識では、ソフトウェアプログラムが写真や動画を分析し、フレーム内の物体を識別します。しかし、機械学習はあらゆる種類の大規模データセットに適用され、スパムメールやクレジットカード詐欺などを見抜くために活用されています。

Facebook、Google、MicrosoftはいずれもAIに力を入れており、よりスマートなオンラインサービスの構築に役立てています。Facebookは過去にもオープンソースのAIソフトウェアをリリースしていますが、AIハードウェアをリリースするのは今回が初めてです。

Big SurはGPUに大きく依存しており、機械学習タスクにおいてはCPUよりも効率が良い場合が多いです。サーバーは最大8基の高性能GPUを搭載でき、各GPUは最大300ワットを消費します。PCIe経由で様々な構成が可能です。

Facebookは、GPUベースのシステムは前世代のハードウェアの2倍の速度を実現したと述べた。「さらに、8つのGPUにトレーニングを分散させることで、ネットワークの規模と速度をさらに2倍に拡張できます」と、同社は木曜日のブログ投稿で述べている。

Facebookによると、Big Surの注目すべき点の一つは、特別な冷却装置やその他の「独自のインフラ」を必要としないことです。高性能コンピューターは大量の熱を発生するため、冷却にはコストがかかります。中には、過熱を防ぐために特殊な液体に浸されているものもあります。

Facebook ビッグサー フェイスブック

Big Surの画像には、サーバー内部の大型エアフローユニットが映っている。 

Facebookによると、Big Surにはそのようなものは一切必要ないという。ハードウェアの仕様はまだ公表されていないが、画像にはサーバー内部に大型のエアフローユニットが映っており、おそらくコンポーネント全体に冷気を送るファンが搭載されていると思われる。Facebookは、コストを抑えるために産業用冷却システムを使用しない空冷式データセンターでサーバーを使用できると述べている。

他の多くのオープンコンピューティングハードウェアと同様に、これは可能な限りシンプルに設計されています。OCPメンバーは、サーバーベンダーが自社製品に「不必要な差別化」を加えることでコストが上昇し、異なるベンダーの機器の管理が困難になる可能性があるとよく言います。

Facebookは、「あまり使用されないコンポーネントを取り除きました。また、ハードドライブやDIMMなど、比較的頻繁に故障するコンポーネントは、数秒で取り外し・交換できるようになりました」と述べています。技術者が触れるハンドルやレバーはすべて緑色に塗られているため、マシンのメンテナンスは迅速に行え、マザーボードさえも1分以内に取り外すことができます。「実際、Big Surはほぼ完全にツールレスです。ドライバーが必要なのはCPUヒートシンクだけです」とFacebookは述べています。

設計を共有するのは利他的な目的のためではない。Facebookは、他の企業がハードウェアを試用し、改善案を提案してくれることを期待している。また、他の大企業がサーバーメーカーに独自のBig Surシステムの構築を依頼すれば、規模の経済によってFacebookのコスト削減につながるはずだ。

機械学習が最近注目を集めているのには、いくつかの理由があります。一つは、システムの学習に使用される大規模なデータセットが公開されたことです。もう一つは、高性能なコンピューターが、優れたAI処理を実行できるほど手頃な価格になったことです。

Facebookは、ストーリーを読んだり、画像に関する質問に答えたり、ゲームをプレイしたり、事例を観察してタスクを学習したりできる、既に開発済みのソフトウェアを挙げた。「しかし、これらの問題に真に大規模に取り組むには、独自のシステムを設計する必要があることに気づきました」と同社は述べている。

絵のように美しいカリフォルニアの海岸線にちなんで名付けられた Big Sur は、Tesla Accelerated Computing Platform を含む Nvidia の GPU を使用しています。

Facebookは、より多くのサービスに機械学習を導入できるよう、GPUへの投資を3倍に増やす予定だと発表した。

「Big Surは前世代の2倍の速度を誇り、トレーニング速度も2倍、ネットワークの探索規模も2倍に拡大します」と同社は述べている。「さらに、8つのGPUにトレーニングを分散させることで、ネットワークのサイズと速度をさらに2倍に拡張できます。」

Googleは、より多くのサービスに機械学習を導入しています。「機械学習は、私たちが行っているすべてのことを再考するための、中核となる変革的な方法です」と、Google CEOのサンダー・ピチャイ氏は10月に述べています。 

FacebookはBig Surの仕様をいつ公開するかについては言及していません。次回のOCP Summitは米国で3月に開催される予定なので、その際にシステムについてより詳しい情報が明らかになるかもしれません。 

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.