ビッグデータを扱う仕組みをコレ一枚にまとめてみました
「膨大な量、急激な増加、多様な形式」といった特徴を持つビックデータは、一般的な業務で使われている表形式のデータを対象としたデータベース(関係データベース/RDB)では効率よく扱えないといわれている。そこで注目されているのが、NoSQLデータベースだ。
データベースの代名詞と言われるほど普及したRDBは、SQL(Structured Query Language)言語で処理の手順を記述している。そのことから、SQLデータベースと呼ばれることがある。例えば、IBMのDB2、OracleのOracle Database、MicrosoftのSQL Serverなどがある。
このSQLを使わず、非構造化データの取り扱いも考慮されたデータベースが登場した。この新しいデータベースは、「データベースはSQLデータベースだけじゃないですよ」という意味を込めてNoSQL(Not Only SQL)データベースと呼ばれている。NoSQLは、特定のデータベース管理システムをさす言葉ではく、RDB以外の総称として使われている言葉だ。有名なものとして、GoogleのBigTable、Amazonの DynamoDBのほか、OSSとして、 MongoDB、 Redis、Apache HBase、Apache Cassandraなどがある。
このデータベースに格納された膨大なデータを多数のデータのまとまりに分割し複数のコンピューターで同時に処理、その結果を集約して短時間で効率よく結果を出すためのソフトウェアが作られました。Hadoopと呼ばれ、ビッグデータ処理にはよく使われている。そこで使われるコンピューターの台数は、数百〜数千台、時には数万台になることがある。
もともと膨大なデータ量なので、一台のコンピューターで処理することは容易ではない。たとえ、高速・高性能なコンピューターを使っても限界がある。
しかし、このソフトウェアを使えば、安価なコンピューターを必要に応じて増やすことで処理の規模を順次拡大できるので処理能力の上限を気にすることがない。そのため、ビッグデータ用として広く使われるようになった。
このような仕組みが生まれたことから、ビッグデータの扱いが容易になり、その適用範囲が広がりつつある。
*更新しました* 今週のブログ
ソリューション営業に求められる4つの能力
「ソリューション営業力を鍛えてください。」
こんなご相談をうけることがあります。しかし、「はい、分かりました」と申し上げられることでもありません。
そもそもソリューション営業力とは、どういう力でしょうか。今週のブログでは、この点を整理してみました。
Kindle版 「システムインテグレーション崩壊」
〜これからSIerはどう生き残ればいいか?
- 国内の需要は先行き不透明。
- 案件の規模は縮小の一途。
- 単価が下落するばかり。
- クラウドの登場で迫られるビジネスモデルの変革。