オルタナティブ・ブログ > 少しでもパラノイアになってみる >

知的好奇心を満たすために、いろいろなことにチャレンジする

Top500 CPUアーキテクチャの推移の考察(2010.6)

»

Top500が公開されました。そこでTop500が公開しているCPUアーキテクチャ毎にRMaxの合計シェアの推移をグラフ化しました。

■Top500ランキングCPUアーキテクチャ毎のRMax合計シェア(2003.6~2010.6)

Top500は、一気にランクインするためグラフは急に伸びたりしますが、おおむねXeon系に集約されていっています。このあたりはPCとあまり変わりありません。特にNehalem系(Nehalem-EP/EX&Westmere-EP)が非常に伸びています。メモリIFを内蔵してメモリ転送量が増えたからでしょうか。今後はXeon以外の選択は経済的ではなそうです。

このようの状況でGPUを搭載したNebulaeが2位にランクインしています。ハイブリッドスパコンは、3位のRoadrunnerや7位のTianhe-1等がありました。PowerXCell 8iで果たせなかったハイブリッド型興隆の時代が来るのでしょうか?

現状Top500には、異なる種類のCPU(もしくはGPU)を搭載しているシステムは、8システムしかありません。また、x86系で周波数が違うCPUを2種類以上搭載しているシステムは11システム存在します。さらに、3種類以上のCPUを当しているユニークなシステムは、東工大のTSUBAMEの1システムしかありません。

2010.6の時点でスパコン市場では、ハイブリッド型は主流とは言えません。

ですが、NVIDIAのTeslaは相当パワフルのようです。真偽のほどはわかりませんが"GeForce 400シリーズの今後は?"に、GF100は一部disableにはしていますが、それ以上に相当性能を殺しているようです。本気を出すことができない理由(ビックサイズや製造元)があるかも知れませんが、アーキテクチャ的には性能がドラゴンボールの主人公の様にまだまだあがる可能性があります。

また、IntelがHPC向けのKights Cornerを発表しました。Larrabeeや昨年から多コアの製品を一部に提供を開始していましたが、ようやく離陸させるようです。

IntelがGPUよりHPCを先にターゲットにするのは、なぜでしょうか。スパコン市場は、Core MAやNehalemアーキテクチャで念願のOpteronを抑えることはできましたし、POWER系もシェア的にはIntelが気にするほどではありません。

私の予想ですが、IntelはNVIDIAのTeslaをつぶしたいのだと思います。

少し前には、Intelの最優先の標的にはNVIDIAだと言われていました(AMDの凋落が激しかったので)。NVIDIAは、GPUをHPC向けプッシュしてきました。この活動とアーキテクチャをよりHPC向けにシフトしたのが功を奏して、FermiアーキテクチャでNebulaeでTop500の2位にランクインしましたし、TSUBAME 2.0でもTeslaは採用されます。現時点ではFermiは、GPUを使用するゲームとHPCにしか興味がもたれていませんが、HPC向けの技術が将来的に一般ユーザに降りてくる可能性もあります。

パラノイアぶりを発揮したIntelは、自分の領域に入り込もうとしたNVIDIAをTeslaがスタンダードになる前につぶすことを決めたのではないでしょうか。このためGPUよりもHPCを先に注力したのではないでしょうか。

ただし、HPC向けにGPUが普及するのか、CPUに戻るのか私にはまだ微妙だと考えています。その理由は、AMDのFusionがあるためです。

AMDは、2011年にAPUを内蔵した製品を出します。2011年時点では、現在のRadeon HD 5xxxxシリーズのコアが入ります(ミドルレンジのコアが入るのか、それともローエンドのコアが入るのか分からない)。もしRadeon HD 5570クラスが入るのであれば、APU箇所だけで倍精度浮動小数点演算で104GFLOPS出ます(注:AMDのページにはRadeon HD 5570の倍精度浮動小数点演算の性能の記載はありません。Radeon HD 58xxはあるのに。)。

FusionのCPU部分がK10で4コア&3.0GHzならば48GFLOPSになり、APU部分を足すと152GFLOPSになります。

現在x86最高の性能を持つXeon X7560(Nehalem-EX)は8コア&2.26GHzです。カタログスペックの倍精度浮動小数点演算は、72.32GFLOPSになります。ただしHyper-Threadingが効かすと1.3倍の性能が出るかも知れません(Sandraの結果を見ると浮動小数点演算がやはり1.3倍出ていた)。1.3倍されれば94GFLOPSです。

カタログスペックだけならばFusionの方が上になります。また、FusionはCPUとAPUの間は、PCI-Expressほど低速ではありません。このため、外付けGPUよりもFusionの効率はもしかすると悪くないかも知れません。

将来的なスパコンの構成は、GPU採用を採用したハイブリッド型に向かうのか、Kights Cornerの様なスパコン仕様のCPUに向かうのか、それともAPU/GPUを搭載したCPUに向かうのかわかりません。

ただし、PowerXCell 8iが最終的に収束に向かったこととPowerPC 4xxのシェアが大きくならないことを考えるとより汎用的なAPU/GPU混在CPUの方が経済的に成功するのではないかと思います。

【CPU/GPU関連】
IBMのTeslaサーバの将来性
ARMのサーバの可能性
GPU競争の行方
CPUの進化に関して

Comment(0)