One Data Source, Multiple Representations
これもまた最近、弊社製品のコンセプトを表現するためにしばしば出てくる言葉です。
一時期データベースというとそれはつまりRDBMSのことを指すケースが多かったわけですが、ビッグデータと人々が騒ぎ始めたころから、キーバリュー型、カラム型、ドキュメント型、オブジェクト型、グラフ型など様々な新しいデータベースシステムの種類が増えてきた感じです。 そしてそのバリエーションもどんどん増えていっているような気がします。
これは処理ニーズに合わせてやはり違う形のデータベースシステムが必要で、それを適材適所使い分けていくというのが合理的な考え方だという主張だと思います。
データベース以外のソフトウェアでは、これは以前から結構ポピュラーな考え方で、良くベストオブブリード(選りすぐり)な製品を選択するというような使われ方をしてきました。
しかしこの方法は組み合わせる製品の種類が少ないうちは制御可能ですが、製品数が増えるにつれ、全体を統一的に連携させて運用することがむずかしくなります。
これはそのままデータベースシステムにも当てはまります。
最もデータベースの場合には、ビッグデータの以前にも業務システム系と情報系システム(検索分析システム)間の情報の断絶というのがあって、様々なデータベースが生成されて(複数の業務データベース、データウェアハウス、複数のデータマート)その整合性を取るための非常に複雑で障害に弱いETL処理というものが介在するというのが一般的なパターンかと思います。
これも1つ1つのETL処理は一般的には単純なんですが、それが複数組み合わされることでだんだん複雑性が増してくるということです。
さらにデータベースの種類毎にETLが必要になると運用は悪夢のようになってしまいます。
インターシステムズのデータベース技術を使うとETLの組み合わせではなくオンザフライで必要なデータ変換をこなしてくれるのでETLそのものを劇的に減らせることで管理上の悪夢を排除できるということだと思っています。
そして何故オンザフライでそんなことがこなせるかというと、データとそれを加工する処理実行エンジンが蜜に連携しながら効率良く処理できるからという基礎技術の特性にたどり着きます。
実際に全てのETLを排除することは様々な事情から困難が予想されますが、まずはなんでもかんでも変換にはETLというステレオタイプからの脱却が必要ではないでしょうか