IBMのTeslaサーバの将来性
IBMは、NVIDIAのTeslaを搭載するサーバを発表しました。
紹介記事では6コアのWestmereサーバ84ノード(1008コア)とWestmereコア(504)+Tesla M2050s(84個)の性能差と消費電力が記載されています。
Wetmere only |
Westmere with Tesla M2050s |
|
倍精度浮動小数点演算 (T FLOPS/rack) |
11.8 |
49.2 |
消費電力 (watts/rack) |
27.6 |
31.0 |
倍精度浮動小数点演算/ 消費電力 |
0.42 |
1.59 |
Teslaあり構成の消費電力あたりの倍精度浮動小数点演算(以下DP)の性能は、CPUオンリー構成の4倍近い性能比になっています。ハイブリッド型サーバがスペック的にDPでは飛躍的に向上する典型的な例の一つでしょう。
IBMは過去にハイブリッドスパコンを作っています。それはPowerXCell 8i(DP:217 GFLOPS)を使ったRoadrunnerです。資料を見るとラックあたり4.9TFLOPS程度のように見えます。LS21(Dual Core Opteron)+QS22x2を組み合わせた1セットがラックに12セット詰まれた構成で計算しました。
また、QS22を標準的な42Uラックに限界に詰め込んだ場合のDPは、12.18 TFLOPSと記載があります。
2008年に組み立てられたRoadrunnerと2010年のTeslaハイブリッドと性能を比べるのはあまりフェアではありません。また、Tesla M2050sのダイサイズ(40nmで529平方mm)とPowerXCell 8iのダイサイズ(64nmの212平方mm)と比べるとその経済性はあまりにも違いすぎる感じがします。残念ながらRoadrunnerのラックあたりの消費電力やQS22の消費電力が明確に記載がないので、消費電力あたりの性能を出すことはできませんでした(Roadrunner全体の消費電力は公開されていますが、それをさすがにrack数で割れないので)。
また、IBMのスパコンと言えばBluewaterがあります。資料に1rackの性能は、1ラックに3073コア搭載 x 1コアあたり32.3GFLOPS=99TFLOPSになります。Bluewaterは大量のストレージも搭載するため、CPUでシャーシを埋められているわけではありません。
また、Bluewaterラックあたりの消費電力は記載されていませんでしたが、Bluewaterは確かCPUの箇所だけピンポイントで冷却する(サーバ室全体を冷やさないはず)ため、ラックに搭載するハードだけの消費電力はあまり意味がないのかも知れません。あんなにPOWER7を敷き占めるため、空冷では追いつきません。
また、POWER7を搭載したPOWER 780は8ソケット(64コア)のため、2T FLOPSは出るようです。消費電力は分かりませんでした。
これ以外にもIBMは、"IBM Sequoia"も開発しています。Blue Gene/Qは、Blue Gene/L,Gene/Pの後継のため、POWER7やPowerXCell 8iとはまた系統が違う製品です。
このようにIBMは、POWER7系からPowerPC 440系及びGPGPUスパコンと多様なラインナップを揃えています。このためか、Cell系はGPUハイブリッドとキャラがかぶったため開発をストップさせたのでしょうか。専用ハード(ゲーム機に転用できないPowerXCell 8i)と汎用ハード(GeForce GTX 480とTesla M2050sは同じコア)はコスト差を埋めることはできませんよね。
東工大のTSUBAME 2.0でもTeslaを使うそうなので、ハイブリッド型スパコンは主流になるのでしょうか。ハイブリッド型スパコンは、PowerXCell 8iでスターとこそ華々しかったのですが、それ以降シェアを伸ばすことはありませんでした。また、現在Top500のTop10で、ハイブリッドはたった2構成です。ハイブリッド型スパコンは難しそうなイメージがあります。
ただし、消費電力あたりの性能比を考えるとCPUオンリーでは打開策がない状況には変わりないため、IBMのTeslaサーバの様に汎用GPUを採用したハイブリッド型へ進むのが消費電力あたりの性能とコストパフォーマンスを一番良いのかも知れません。
【CPU/GPU関連】
・ARMのサーバの可能性
・GPU競争の行方
・CPUの進化に関して