hadoopの将来を組み立てる?
»
YARN: Weaving the Future of Hadoop
Big Dataといえば、HadoopというくらいにBig Dataに関心のある人は知らない人がいないくらい有名になってきたと思いますが、普及の程はどうでしょう?
そこそこ導入例も増えていることと思いますが、爆発的に増えているというほどではないように感じます。
使いこなすのが難しいとよく聞きます。
Hadoopの解説書を読んでみたことがありますが、その感想も同様で使いこなすのは結構骨が折れそうだと思いました。
中でも中枢であるHDFSという分散ファイルシステムを使いこなすのが難しい感じでした。
そんな中、Hadoop V2のYARNという仕組みが、その使いこなしの難しさを一掃する切り札として登場するとのことです。
この記事によるとストリーミングアプリケーション(データを流し込むアプリケーション、イベント処理?)や通常の業務アプリケーションやビッグデータアプリケーションを同じように意識せずに動かせるようになるとのことです。
要するにビッグデータ分析用にわざわざ別環境を用意する必要がなくなるということで、適用に至るハードルを大きく下げるのは間違いなさそうです。(データのフィードから蓄積、分析の流れを一気通貫できる)
要するにHDFSのアクセスをラップしてより簡単に使えるようにしたということのようです。
SpecialPR