オルタナティブ・ブログ > 少しでもパラノイアになってみる >

知的好奇心を満たすために、いろいろなことにチャレンジする

Llanoの感想

»

AMDからようやく本命のGPUを搭載したCPU(Llano)であるAMD Aシリーズが発表されました。以下がその主要なレビューだと思います。

AMDが発表したメインストリームAPU「Llano」のアーキテクチャ
Fusionをいよいよメインストリームへ投入「AMD Aシリーズ」
LlanoことA-Series APUを搭載したノートPCプラットフォームを試す
AMD,Fusion APU「A-Series」のノートPC向けモデルを正式発表。アブダビで開催された説明会の内容を基に,特徴を整理してみる
ようやく「Llano」登場──“Sabine”ノートで実力をチェック
新Fusion APU「AMD Aシリーズ」を試す

記事としては後藤氏の記事が、レビューとしては大原氏の記事が面白いと思います。

2006年にAMDがATIを買収してCPUにGPUを搭載するとアナウンスされました。当初2008年ごろには出すような話もありましたが、CPU開発には4年かかると言われているため、2年でだすにはMCM(Multi Chip Module)で対応するかと思ったのですが、ソケット戦略もあってか2011年のLlanoまでお預けになりました。

最初はモバイル版のため性能はちょっと足りないように見えますが、デスクトップはCPUが2.9GHz、APUが600MHzまでになります。この数字ならばカタログスペックは、CPUの浮動小数点演算は46.4GFLOPS、GPUの浮動小数点演算は480GFLOPSになると思います(CPUが倍精度、GPUが単精度ですが...)。合計すると526GFLPS程度になります。

カタログスペック的には、Radeon HD HD 5570ぐらいです(LlanoのGPUのベースRedwoodなので当たり前か)。ミドルレンジの下のほうの性能となりそうです。それでもCPUに盛り込まれた機能としては十分高いですが。

ただ、気になるのはメモリ帯域です。GPUは、浮動小数点演算に特化されていますが、それをサポートするのに大量のメモリ帯域も必要になります。浮動小数点演算とメモリ帯域をグラフ化すると以下になります。

GPUは、基本的に傾きが似ています。この傾きの上を行くとメモリ帯域が処理能力よりも低いことをさします。

例えば、Radeon HD HD 5570は、浮動小数点演算は520GFLOPSで、メモリ帯域は28.8GFLOPS(DDR3なので)です。ちょっと上のRadeon HD HD 5670は620GFLOPSで、64GB/sec(GDDR5)です。Llanoのメモリ帯域はDDR3-1866が2chで29.8GB/sになりなす。

LlanoはDDR3ではメモリ帯域が不足しているように見えます。このことを顕著なベンチマークとでているのは、"LlanoことA-Series APUを搭載したノートPCプラットフォームを試す"でFishBowl Benchmarkの結果でしょう。

DDR3ではメモリ帯域が足を引張り、宝の持ち腐れになる可能性があります。

さすがにPC用のCPUにチャンネル数を増やすしたり、GDDR5を搭載するの経済的ではないでしょう(IntelのCPUでは3chもありますし、4chも出てくるようですが...)。では、DDR3の次のDDR4(4.266Gbpsが2chで68GB/secぐらい?)でこのギャップは埋められるのでしょうか?

DDR4のターゲット転送速度は4.266Gbpsが2chで68GB/sと言われています。これは、現在のRadeon HD 5670のメモリ帯域になりますが、DDR4の普及が2013年頃と言われています。今から2年後になれば、CPUに搭載されるGPUの性能も2倍になるでしょうから、CPU(GPU)が欲しているメモリ帯域とDDR系が提供できるメモリ帯域の差は埋めるとは思えません。

そうなるとやはり、CPUの上にメモリを搭載するTSV以外に選択肢が実質なさそうに思えます。今のところGPUには大量のメモリを必要としていません(本当は大量に必要なんだと思いますが...)。このため、外部キャッシュみたいな方法でTSVで乗せるのが常態化するのでしょうね。

他に気になったのは、Llanoの2コアタイプです。最初はバージョンは、4コア版のうち2コアをdisableにして出荷されるようですが、それは経済的ではありません。資料にも4コア版のトランジスタ数は14.5億で、2コア版は7億5800万トランジスタとあります。半分にしたものになるでしょう。

ですが、どうやって半分にするのでしょうか?IO系をぶった切るようなことをしないので、以下の様に半分にするのでしょうか?

よくわかりませんが、コスト競争も必要なので、ここら辺のバリデーションも作成もIntelと競争しないといけないのですね。

LlanoはCPUはK10を使いました。GPUは、Radeon HD 5xxxxシリーズ系です。どちらも最新のものではありませんが、開発リスクを考えれば当然です。次のTrintyは既にダイもできている様なので、Llanoは練習だったのでしょう。

ですが、消費電力あたりの性能はいいデータも出ているため、ロードマップを見る限りは、Llano系は普及しそうに思えます。

また、GPUが今までのVLIWではなくSIMD形式に変更になる様なので、そちらの動向も気になります。ItaniumがVLIWを放棄したと言ううわさもあるので、VLIWはあまり効率的ではないのでしょう。

Comment(0)