オルタナティブ・ブログ > Mostly Harmless >

IT技術についてのトレンドや、ベンダーの戦略についての考察などを書いていきます。

Intel の AI プロセッサは若干付け焼き刃的な感じがする

»

インテルがマシンラーニング用プロセッサを発表しました。NNP (Neural Network Processor) というネーミングのようです。 NPU、DLP、Neural Engine に続き、また新しい呼び名が増えてしまいました。。

Nvidiaに負けたくないIntelがニューラルネットワーク専用プロセッサーNervanaを年内発売

記事では Nvidia への対抗心むき出しのように書いていますが、この分野では Google の TPU も学習向けに強化されたりしていますし、かなり競争が激しくなっています。

ai_shigoto.png

Intel は昨年 8 月に Nervana という NNP 開発の会社を買収していたんですね。昨年 8 月といえば、第 1 世代の TPU が発表された直後でもあり、Intel としても AI への早急な対応を迫られたのかも知れません。

Intel、機械学習最適化チップを手掛けるディープラーニングのNervanaを買収

Nervana が設立されたのは 2014 年、買収時の従業員数は 48 人だったということです。しかもこの時点では完成した製品は無く、

Nervanaの「Nervana Engine」は、2017年に完成する見込みのディープラーニングに最適化したASIC

ということで、かなりな青田買いだったということが伺えます。しかし最初の記事にもあるように、10 月 18 日の時点でベンチマークも何も出ておらず、

発売は年内だそうだが、大丈夫か。

とか書かれてしまっています。実際、大人の事情がいろいろ絡みあって、「年内に出すって言っちゃったからとりあえず発表はするけど、実はもう少し時間がかかりそうなんだよね。」なんてことは良くある話で、今回もそうじゃ無いのかなー、なんて、余計なことを考えてしまいます。

そもそも、Nervana 自身のアーキテクチャについても、あまり詳しい情報がありません。テンソルベースと言われていますが、行列を扱うのであれば、ベクトルプロセッサやGPUなど、これまでもいろいろあったわけで、あまり新味はありません。この図を見ると、コア部分は GPU などに似ていて、メモリ周り(オンチップメモリの量やアクセス方法)とかデータ転送の速度に特長がありそうです。(他に図が無いのでそれ以上はわからないということもありますが)こちらの記事を読んでみても、メモリアーキテクチャと(チップ間のデータ転送速度が速いことでの)スケーラビリティによって、マルチプロセッサ構成での全体のスループットを上げるような方向性のようです。記事には固定小数点の新しい数値フォーマットが採用されたとも書いてあり、これにはちょっと興味があります。初代の TPU は推論に特化したため、8 ビット整数しかサポートしておらず、それによって省電力と処理性能の向上を図っていました。今回は学習もするということで浮動小数点が必要なのでしょうが、NN の計算は定型的なので、固定小数点でも大丈夫という判断なのでしょう。浮動小数点よりも回路は小型化でき、性能も上がりそうです。

Nervana 買収の 4 ヶ月後に、米 Intel は IA と Nervana 統合する計画を発表しました。

Intel、人工知能プラットフォーム「Nervana platform」発表

Xeon に Nervana を統合するということですが、まあ、それはそうでしょうね。買収した技術と自社の既存技術を統合するというのは納得できます。(というか、そのために買収するわけですし)

ところが、その翌月に行われた日本国内での発表では、さらに踏み込んだ計画が発表されています。

インテルアーキテクチャもディープラーニングに有効、「GPUが最適は先入観」

この記事では「2020年までにマシンラーニングにかかる時間を1/100にする」と書いてますが、何と比較して 1/100 なのか、Intel のスライドには書いてあるようですが、「現在の最速のソリューションと比較」とまでは読めますが、その下は小さすぎて読めません。TPU との比較でしょうか。(TPU はすでに「従来の CPU/GPU の 15-30 倍速い」っていってます)

しかも、「速度100倍」じゃ無くて、「かかる時間1/100」っていうのも、なんだかすっきりしない言い回しです。しかしこれは、意地悪な見方をすると、単体のプロセッサの性能で勝負するのでは無く、上に書いたようにメモリアーキテクチャとかチップ間の接続の高速性を武器に、「システム」として処理時間を短縮、ということなのかも知れません。(後で「嘘つき」と言われないように、マーケティング担当者はいろいろと言い回しを考えるものです)

いろいろ見ていると、コア部分の処理では GPU に似た構造で固定小数点対応、メモリアーキテクチャとチップ間接続を高速化してシステムとしての性能を上げる、ということのようです。中身じゃ無くてシステム性能を重視というのは Intel らしいと言えるのかもしれません。しかし、時間切れが近づいてバタバタと発表した感じも否めず、今後スケジュール通りに出てくるかが注目されます。

Comment(0)