GPU Technology Conferenceの感想
NVIDIAの単独カンファレンスであるGPU Technology Conferenceが開催されたので、その感想を書いてみます。
「3ds Max」のデモであるGPUクラウドサービスは、時代を感じてしまいます。スパコンにもGPUを使用される時代ですから、クラウド側にGPUスパコンを配置して結果をクライアント側に持ってくるのは想定されるサービスです。まだGPUの用途が限定されているため、一般化はまだまだだと思いますが近い将来では違うかも知れません。
ロードマップとしてKeplerやMaxwellを公開しました。製品としては、Tesla系を出した後に、GeForceやQuadro系のグラヒック製品を落とし込むようです。これはFermi世代で行ったGF100を出した後に、GF104を出荷したのと同じ戦略です。ハイエンドはTeslaと共用チップを、その後最も売れるカテゴリであるハイミドルレンジにHPC向け機能を落とした製品を出すようです。フラグシップであるハイエンド製品は、ゲームメーカにアピールになっても一般ユーザに大量に購入されるためにではないため、妥当な戦略に見えます。
NVIDIAがロードマップを公開するのは、今までなかったと思います。CPUの世界では、Intelにしろ、AMDにしろ1年ばかりのロードマップははっきりと公開しています。ですが、GPUは半年以内のロードマップも制s期にはアナウンスしません。理由はわかりませんが、CPUとGPUの設計期間が違うためでしょうか。
NVIDIAが公開したロードマップは、消費電力あたりのパフォーマンスもアンナンスされています。2011年にKepler(ケプラー/28nm世代)、2013年にMaxwell(マックスウェル/20nm世代)です。KeplerはTesla比で5倍、MaxwellはTesla比で16倍になるようです。FerminがTesla比で1.5倍であることを考えると、Kepler/Fermiで3倍、Maxwell/Keplerで3倍となり、世代毎に3倍ずつ増えることになります。
Teslaの性能は、以下になります(ここではボード単体の性能)。
製品名 (開発コード) |
浮動小数点 演算 (GFLOPS) |
TDP(W) |
C1060 (GT200/Tesla) |
77.8 | 188 |
C2050 (GF100/Fermi) |
515.2 | 238 |
GT200がGF100の1.5倍と言うのはどこから出た数字なんでしょうか。単精度浮動小数点演算ならば1.5倍にあるかも知れませんが、Fermiは前世代(Tesla)から大幅に倍精度浮動小数点演算をあげているはずですが。よくわかりません。
Teslaの倍精度浮動小数点演算は専用コアで対応したため、倍精度浮動小数点演算は単精度浮動小数点演算の1/8しか性能がありませんでした。Fermiは単精度浮動小数点演算のSP(Streaming Processor)を2サイクル使って倍精度浮動小数点演算の計算をさせたため、単精度浮動小数点演算の1/2の性能まで上げることができるようになりました。
Keplerはどうするのでしょうか?プロセスが1世代増えれば、トランジスタを倍載せることができますが、それでは3倍に到達しません。Fermiのダイサイズ(529平方mm)を考えれば、これ以上大きくすることは無謀です(今でもでかすぎる)。High-k/Metal-Gateが導入されれば、消費電力は大幅に低減できるかも知れませんが、それでも3倍は無理があるように思えます。
もしかすると、次のKeplerには消費電力を抑える盛り込み(Nehalem等に搭載しているようなもの)があるのかもしれませんが、SPを倍精度に対応(1サイクル)させながら、SP数を1.5倍にすれば3倍に到達するというのはどうでしょうか(倍精度対応でSPのサイズが大きくなりますが、28nmでそれをカバーする)。
NVIDIAがロードマップを公開するのは意外でした。ロードマップを公開するのは、ユーザの引止めとライバルへの戦略の公開のメリット・デメリットがあります。どちらがよりメリットが大きいかと考えて、NVIDIAはロードマップ公開の方が大きいと判断したのでしょう。NVIDIAのGPUは、長期計画が必要なスパコンにも使用されるためロードマップの公開は必須です(重要な顧客にはロードマップを公開しているでしょうが)。もしくは、HPC向けGPUにはライバルをけん制(IntelのKnights Corner)の意味合いもあるのかも知れません。
NVIDIAのロードマップを公開したので、AMDにもCPU同様にGPUのロードマップを公開して欲しいものです。
【GPU関係】
・NVIDIAのメディアタブレット戦略
・Top500 CPUアーキテクチャの推移の考察(2010.6)
・IBMのTeslaサーバの将来性
・GPU競争の行方