APUの将来を勝手に予想してみる
Trinityの次はなんだろうかなと考えてみました。
まずは、過去の製品を見てみます。
APU | プロセス ルール (nm) |
ダイサイズ (平方nm) |
CPUコア | GPUコア | GPU コア 数 |
GPU 周波数 (MHz) |
GPU浮動小数点 演算-単精度 (GFLOPS) |
Llano | 32 | 228 | Star | VLIEW5 | 400 | 600 | 480 |
Trinity | 32 | 246 | Pildriver | VLIEW4 | 384 | 800 | 614 |
LlanoからTrinityはプロセスルールを変えずに、CPUコアとGPUコアの両方を変更して性能アップを目指しました。シュリンクしていないため、ダイサイズは微妙に増えました。
Trinityの次のKaveriに関しては、AMDが発表しているロードマップとして以下が詳しいです。
・"AFDSでAMDがCPUロードマップを刷新、サーバーにもAPUを投入"
2013年に登場予定のKaveriは今のところ以下が分かっています。
・CPUコアはSteamrollerコア
・GPUコアはGCN
・プロセスルールは28nm
GPUに関しては、1TFLOPSに到達する可能性があると言われています。
同じGPUコアがGCNのRadeon HD 7770は、640コア&1,000MHzで約1,280GFLOPSに到達しています。もし、KaveriのGPUの性能が1TFLOPSに到達するにはRadeon HD 7770と同じコア素うで周波数を780GHzにするか、同じ周波数で500コアにするかになります。
Radeon HD 7770のダイサイズは28nmで123平方mmです。"ここ"にRadeon HD 7770のダイ写真があります。この中でバスを除くとコア部分はダイ全体の70%とすると86平方mmです。
Trinityは246平方mmですが、GPUに割いている割合は35%前後で90平方mm前後かと思われます。Kaveriも28nmでTrinityと同じサイズと仮定します。
ダイ写真をそのまま比較してもそんな簡単に入れられないと思いますが、KaveriにRadeon HD 7770と同じかもしくは少し下回るサイズのものを十分搭載可能と思われます。
(注:私の予想ではKaveriは、Trinityよりも小さくなるのではないかと予想しています。TrinityはLlanoからシュリンクできなかったため、仕方なく大きくなりましたが200平方mm超えは少しダイサイズが大きいのではないかと考えています。同じダイをノートPCにも入れることを考えるとKaveriはTrinityよりも小さくしてきてもおかしくはないと考えています。CPUはSteamrollerコアで大きくなると予想されるため、GPUはRadeon HD 7770よりも小さいなものになるのでは?800GFLOPS前後を目標にするような気がしています。)
28nmでのシュリンクとGCNの導入でKaveriは、Trinityよりも強力なGPUを搭載されると思いますが、別の問題が出てきます。
それはメモリ帯域でしょう。Radeon HD 7770はメモリ帯域は72GB/sもあります。ですが、DDR3-1866 2chでは29.8GB/s程度です。DDR3-2133をサポートしても34.1GB/s程度しかあがりません。これではRadeon HD 7770と比べても半分以下のメモリ帯域しか確保できません。
また、APUはCPUも搭載しているため、メモリ帯域をGPUのみで使用できない事情もあります。APUとしては、DDR3-1866 2chの倍、もしくは3倍のメモリ帯域を本当は欲しいところでしょう。
KaveriでソケットをFM2に継続するため、Intelの様にメモリのチャネル数を増やすこともDDR4の採用もありえません。プロセスルールの進化によって浮動小数点演算の性能はリニアに向上できても、足回り(メモリ帯域)は同じようについてこれません。
この解決策はなくもありません。後藤氏のコラムを読んでいてもIntelはHaswellでキャッシュを2.5Dを盛り込む予定に見えますし、AMDも採用することを示唆しています。PC向けCPUはeDRAMを2.5Dで搭載するのがほぼ規定路線に見えます。
AMDとしてはAPUにIntelよりも高性能なGPUを搭載しつづけたいでしょう。そうしなければ差別化もアドバンテージもないからです。ですが、GPUはCPUと違ってメモリ帯域を必要とします。DDR3 2chでは狭すぎます。このため、2.5DでCPUパッケージ上にeDRAMを搭載してキャッシュとして搭載するのが最も無難な選択肢に見えます。
CPUが昔、L2をパッケージ上に搭載したのと似ている感じはしますが、今回はDRAMを搭載です(CPUは浮動小数点演算やL2などをこうやってパッケージ外から内蔵してきた歴史があるため、将来的にはDRAMも...POWERでもやっているしな)。
このように考えると2013年にはCPUはまた一段と高性能化するように見えて、2012年よりも面白い年ではないかと思えてなりません。