Top500 CPUアーキテクチャの推移の考察(2010.11)
2010.11のTop500が公開されました。そこでTop500が公開しているCPUアーキテクチャ毎にRMaxの合計シェアの推移をグラフ化しました。
■Top500ランキングCPUアーキテクチャ毎のRMax合計シェア(2003.6~2010.11)
これを見てx86の寡占化がされに進んだと考えるのはミスリードされています。
Top500のNo.1であるTianhe-1Aは、CPU(Xeon X56xx) & GPU(Tesla M2050)ハイブリッドスパコンです。ですが、Top500の資料では、Tianhe-1AのProcessorはIntel EM64T Xeon X56xx (Westmere-EP)と記載されています。
「最近の話題 2010年10月30日」を参考にするとWestmereの1CPU=70.32GFLOPS、M2050の1GPU=515GFLOPSです。このため、Tianhe-1AのCPU部分が1.01PFLOPS、GPU部分が3.69PFLOPSになり、理論値は4.7PFLOPSです。ですが、RMaxが2.57PFLOPSです。
ここで、2.57PFLOPSにどれくらいの割合がCPUとGPUなのかデータがありません(どこかにあるのかも知れませんが見つけられませんでした)。CPU部分が理論値の85%の0.86PFLOPS達成できたとすると、GPU部分が残り1.71PFLOPSになります。これは、理論値の50%以下になります。このあたりの割合でTop500のProcessorを記載してもらえないとCPUアーキテクチャ毎のRMax合計が正しい値が出てきません。
このため、昨今のハイブリッドスパコンが多くなるとRMaxのプロセス毎のデータはあまり意味を成さないと思います。
2010.11のGPUスパコンは、Top500の中で9台ありました。2010.6の時点で4台だったことを考えると増加傾向を示しています。それだけコストパフォーマンスをあげるのに適しているのでしょう。
ただしGPUスパコンは、理論値と実測値と大幅に乖離があります。
GPUスパコンはCPUオンリースパコンから比べると実測値と理論値には大きな差があります。このあたりがGPUを使用するのが難しいところなのかも知れません。PCI-Expressがネックになっているのか、それともメモリの転送速度こそ化物的速さでも搭載量が少ないから効率が上がらないのでしょうか。
GPUスパコンはまだまだ改善できそうに見えます(素人考えですが)。
スパコンは今後どのような進化を遂げるのでしょうか。現状NVIDIAのGPUのロードマップは魅力的なものが提供されています。効率だけ言えば、プロセスルールが改善し続けるかぎり、同様なペースで性能アップが予想できます(使いやすさはわかりませんが)。
これにストップをかけるのは、近い将来ではBlue Gene/Qでしょう。ただし、Top500でのBlue Geneのシェアが伸びていないことを考えると今後Blue Geneがスパコンのトレンドを牛耳るとは思えません。
IntelのメニーコアであるKnightsシリーズはようやく日本でも紹介されました。22nm世代で登場すると言われています。22nm世代は2011年後半にも出荷されるといわれているだけに、Knightsシリーズは2012年ぐらいには出てくるかも知れません。勝負が決まった後に登場するようにも思えますが、GPUスパコンの効率が向上しなければKnightsシリーズも馬鹿にできないかも知れません。
ただし、現時点のサンプルはPCI-Expressカードなので、現在のGPUが抱えている問題は解消されないと思います。このため、Intelとして本当の勝負はCPUにKnightsシリーズの機能がC搭載されるようになってからでしょう。それはあまりにも遠い未来過ぎますが。
AMDのAPU搭載CPUは、メモリ転送速度以外はGPUが抱えている問題を解消できそうに思えます。ですが、AMDのロードマップを見るかぎり2012年の時点で、APUを搭載したサーバ向けCPUは見当たりません。
このため、GPUスパコンはAMDがよっぽど次の製品がHPC向けにアレンジされていなければ、少なくとも2011年まではNVIDIAの天下が続きそうです。
【スパコン】
・GPUを使ったクラウドサービス開始されますがこのままでいくのだろうか
・GPU Technology Conferenceの感想
・AMD 2010 Financial Analyst Dayの感想
・Top500 CPUアーキテクチャの推移の考察(2010.6)