AMDのBulldozerとBobcatの感想(Hot Chips 22)
Bulldozer/Bobcatは昨年の2009 Analyst Dayで発表されていますが、詳細に関しては不明でした。その二つCPUコアに関してHot Chips 22で概略が発表されました。以下が詳しいリンクです。
・"ついにベールを脱いだAMDの「Bulldozer」と「Bobcat」"
・"【Hot Chips 2010】“Bulldozer”と“Bobcat”に関するスライドが公開"
・"AMD Discloses Bobcat & Bulldozer Architectures at Hot Chips 2010"
・"AMD Sets New Mark in x86 Innovation with First Detailed Disclosures of Two New Core Designs"
・"設計思想を省電力、高クロックに切り替えたBulldozerコア"
■Bulldozer
現在のCPUはスループットでの性能向上の方向に向かっているため、IntelのCore i*シリーズで搭載されたSMTに向かうか、コア数を増やすかのどちらかです。前者はIntel及びIBMが採用しており主流です。
AMDは、コア数を増やしてはコスト(トランジスタ)が多すぎるが、SMTでは性能向上が低いと考えて、クラスタ構成を採用しました。このあたりは、後藤氏の"Multihreading Architecture Comparison"が最も分かりやすいと思います。
コストと性能アップのバランス的をどちらに振るべきなのかは難しいところではないかと思います。IntelがNehalemコアでSMTを採用したのは消費電力あたりの性能向上が効率的だからと書いてありました。ならば、AMDのクラスタ構成は消費電力あたりの性能向上は妥当なのでしょうか?消費電力に関しては今回は言及がなかったため、消費電力あたりの性能がわかりません。
Nehalemコアは、1コアあたりDecodeが4個ついています。Bulldozerの1クラスタモジュールも4Decodeです。Decodeの性能が両社では違うと思いますが、IntelのSMT付き1コアとAMDの1クラスタモジュールは同等の性能を出そうとしているように見えます(Decode後の処理する機能の箇所が違うため、性能差はありますが)。
AMDのK10コアは1コアあたり3DecodeでAGUも3個でした。Bulldozerは1クラスタモジュールが4DecodeでAGUが4個です。K10とBulldozerの比較は、"A Real Redesign"の図が最も分かりやすいと思います。
私は、Bulldozerはより簡易にしてコア数を増やしていると考えていました。消費電力あたりのスループットを高めるためには、それが最も効率的だからです。OracleのUltraSPARC T2がその最も極端な例です(極端すぎてシングルスレッドの性能は悪いが)。Decode等を見ていると案外BulldozerはIPCの性能低下はK10から比べると遜色ないのかも知れません。
Bulldozerの説明では、ダイサイズ、周波数及び消費電力に関してはありませんでした。周波数は性能をダイレクトに計れますし、ダイサイズと消費電力で今後の製品(Shanghaiに対するIstanbulの様な製品)が予想できます。
最近のOpteronのダイサイズは、200平方mm後半が続いていました。Shanghaiで258平方mmです。32nmのシュリンクとコアサイズが大きくなることを考えるとShanghaiと同程度の大きさを目指すのではないかと推測しています(コアの数的にも)。Istanbulサイズ(346平方mm)を32nm/High-K/Metal-gateの最初の製品に持ってくるようなチャレンジは安全志向なAMDはやらないでしょう。Shanghaiクラスのダイサイズならば、結構周波数は伸びそうな予感がします。
■Bobcat
Bobcatの特徴として私が気になった以下の点です。
・メインストリームの90%の性能を実現
・1Wを実現可能
メインストリームノートPCと言えば、"2010 メインストリーム・ノートPCプラットフォーム"のことだと思われますが、残念ながらPhenom II X920~Athlon II P320を搭載したノートPCはあまりないため、Turion II Neo K625を比較基準とします。
Bobcatの対抗製品はAtomです。その現行製品であるAtom N470等が有名でしょう。
WEIのプロセッサは、Turion II Neo K625は4.3、Atom N470は2.71、Core i3 U330が4.2です。
Bobcatは、メインストリームの90%の性能とあるため、Athlon II P320の90%と考えます。Athlon II P320の周波数が2.1GHzのため、Bobcat相当は1.9GHzと考えられます。Turion II Neo K625の周波数は1.5GHzのため、Bobcat=Athlon II P320の90%=Turion II Neo K625の125%前後あたりの性能ではないかと推測できます(周波数だけの比較になりますが)。
Bobcatの消費電力と価格はわかっていませんが、性能はAtomに対してアドバンテージはありそうですし、CULVとも戦うことができるのではないでしょうか。
1W版は、周波数がわからないため性能がわかりません。大概は、非常に低い周波数になるでしょう。スマートフォンに入るかと言われるとチップセットもあるため無理だと思いますが、Bobcatは今流行のメディアタブレットには面白い存在だと思います。
例えば、東芝のlibretto W100は非常にユニークな製品です。Pentium U5400を採用した理由は、デュアルディスプレイを行うためだそうです。これは現行のARM系チップやAtomでは実現できなかったためです(コストが増える)。
BobcatのGPU部分はどのような機能があるかわかりませんが、Radeon HD 4250クラスぐらいはあるでしょう。それならば、デュアルディスプレイが簡単にできそうです。
Intelはメディアタブレットに対応するAtom用のOak Trailを2011年に予定しています。Bobcatの登場とバッテングしていますが、両者がメディアタブレットをARM系と競うのは面白い状況ではないかと思われます。
■まとめ
AMDにとってBulldozerは、K8以来の大幅なアーキテクチャチェンジです。K8の登場が2003年です。この間、コアを増量したり小幅改造(K10)を行ってしのいできましたが、IntelのCore MAの登場でK8/K10の性能は登場時期とは違って色あせてみます。
Bulldozerは、どちらかと言えばスループット向けにシフトしているため、サーバ市場を重視された設計に見えます。BulldozerでK8以来の躍進が果たすことができるかが気になるところです。
AMDはIntelほど開発力があるわけではないため、BulldozerとBobcatの2つのコアを開発するのは容易ではないように思えます。今のAMDはモバイル向けは若干デスクトップ系CPUとは違いますが、それでもほとんど中身は同じです。Bobcatは、K8/K10及びBulldozer系とはまったく違うアーキテクチャを採用したCPUです。
二つのアーキテクチャを開発できるほどAMDに体力があるか心配になりますが、TSMCや将来的にはGFで作ることも想定されていると思われるため、派生品が多くできるのではないかと推測しています。それこそAtomが目指していたARM系守備範囲に入っていくのが目標でしょう(1W動作とか)。
Bobcatが最近最も熱い市場と言われているメディアタブレットにも採用されれば今後の展開は面白いと思います。
最近のAMDは、Athlon 64 X2が出始めたころに比べて元気がありませんでしたが、Bulldozer及びBobcatでまた良い時代に戻れるとCPU競争が激化して面白いと思います。
【CPU関連】
・OracleのSPARC ロードマップの感想
・Phenom II X6 1090T BlackEditionに換装してみた
・AMDの新しいCPUアーキテクチャであるBulldozerの性能に関して
・NVIDIAのメディアタブレット戦略
・CPUの進化に関して