オルタナティブ・ブログ > むささびの視線 >

鳥のように高いところからの俯瞰はできませんが、ITのことをちょっと違った視線から

データウェアハウス関連のプレイヤーの顔ぶれがずいぶん変わったんだなぁと

»

 来週、久しぶりにビッグデータ、データウェアハウス関連のセミナーで講師役を勤めることになった。

 そんな、わけで久しぶりに業界の昔を振り返ってみるなどしてた。おそらくデータウェアハウスという言葉が日本で定着し始めたのは、1996年とか19997年とかそのくらいの頃だと思う。IT業界では、一気にこのデータウェアハウスはブームに。いまでも憶えているけれど、とにかくこのキーワードを掲げるだけで、とにかく人がよく集まったのだ。

 ある展示会イベントにスポンサー企業としてして出展し、スポンサーセッションで会場内のこじんまりとした部屋でデータウェアハウスをテーマにセミナーを開催した。多分席数は40か50くらい用意していたはず。そこに、なぜか100名以上の人が集まってしまった。急遽席を増やせるだけ増やして、さらには立ち見も受け入れたけれど、10人以上の人は会場に入れず。そのせいで、受付担当にかなり怒って抗議する人がいたくらい。実際にセミナーを始めると、講師である自分のすぐ横のほうまで、立ち見で聴いている人がいる。このときは、別の意味で緊張したことを記憶している。

 いまのビッグデータブームにしても、当時のデータウェアハウスにしても、多分にベンダーがハードウェアやソフトウェアを売りたいがために、マーケティング的に煽りまくった結果もあるように思う。なので、ブームが少し落ち着いた頃に、やっと中身のあるソリューションの形が見えてくる。ビッグデータに関しては、まさに実態が見え始めたというところではないだろうか。

 さて、ちょっと話が変わるが、データウェアハウスのことを振り返ってみると当時からだいぶプレイヤーが変化している。90年代後半に、もっともこの領域で強かったのはテラデータだろう。これにタンデムコンピュータのNonStop Himalayaなんていうのもあった。Oracleももちろん、Release 7.3というバージョンでデータウェアハウス関連の機能を実装し、この領域に進出したけれど専業のテラデータなどと渡り合うのにはけっこう苦労していたっけ。

 IBM DB2もあったけれどUNIX系ではあまり目立っていなかったし、Microsoft SQL Serverはデータウェアハウスの領域ではほとんど見かけなかった。InformixやSybaseもまだまだ元気時代でもあり、この2つもそれなりに健闘していたっけ。さらに、少ししてからRed Brickというデータウェアハウス専用のデータベースも登場することに。

 これら当時のプレイヤーのうち、いまも現役なのはテラデータとOracleだけだ。タンデムNonStopはコンパックに買収され、いまはHPに。InformixとRed BrickはIBMに買収され、最近ではその噂をほとんど耳にしなくなってしまった。Sybaseはご存じの通りいまやSAPのものに。

 変わって、ニューフェイスがたくさんいる。ストレージベンダーからいまやソフトウェアベンダーになりつつあるEMCにはGreenplumがあり、IBMに買収されてしまいpure dataブランドとなったNetezza、HPには買収したVertica Analytics Systemがある。さらには、アシストが押しているInfiniDB、元のIngres社でいまはActian社が提供するVectorwiseなんていうのもある。インメモリデータベースのSAP HANAも、もしかしたらプレイヤーの1人に加えてもいいのかもしれない。

 もちろんテラデータは健在だし、OracleにはExadataがある。忘れてはならないMicrosoft SQL Serverだって、いまは立派なデータウェアハウスのプレイヤーの一員だろう。以前のデータウェアハウスブームのとき以上にプレイヤーが乱立しており、まさに群雄割拠状態なのだ。で、これら新しいプレイヤーにほぼ共通しているテクノロジー要素がカラムナーデータベースというやつ。いわゆる列指向で、OLTPには向かないけどとにかく高速に検索できますよという技術だ。これに完全に特化したデータベースもあれば、分析用に最適化したカラム型圧縮を提供するといったものもある。

 どれを選べばいいのかは、頭を悩ますところ。ポイントは、カタログ値やベンチマーク結果だけを鵜呑みにするのではなく、自分たちがやりたいことに向いてるのはどれかを冷静に見極めることだろう。小さく安く始めるという発想もあれば、とにかく速い環境が必要だってこともある。検索の速さよりは、じつはロードの速さを重視するべきかもしれない。このあたりは、企業なりの課題ごとに重視すべきポイントは変わるのだ。

 とにもかくにも、いま流行のビッグデータをやりたければ、その前にデータウェアハウスなりをしっかり社内で使いこなせているというのが大前提になるだろう。そもそも、ビッグデータだと思っていたことが、じつは自分たちの手許にあるデータウェアハウスで賄えてしまうかもしれない。Twitterのうわさ話を分析する前に、自社のコールセンターログをきちんと分析できる環境はあるのかみたいな話しも。

 ということで、セミナーのタイトルも「ビッグデータってデータウェアハウスじゃダメですか ?」だったりも。昔話に加え、ここ最近、さまざまな取材をしている中から見えてきたビッグデータ、データウェアハウスについて紹介する予定だ。

Comment(0)