【図解】コレ1枚でわかるアナリティクス・プロセス
CRMやSCM、生産管理システムなどの業務アプリケーションからは、日々膨大なデータが生みだされています。それらは、それぞれの業務を効率よく処理するために作られたシステムであり、生みだされるデータも、その目的のためのみに使用されています。これらデータの中から業務の状態を可視化するために、あるいは、業務上の課題や知見を見つけ出すために、データを抽出・収集し、BIアプリケーションのためのデータベースDWH(Data Warehouse)に集める必要があります。
しかし、業務システムのデータベースは、それぞれの業務処理に最適化されているため、そのままのデータ形式でDWHに集約・統合することはできません。そこで、各業務システムのデータをDWHのデータ形式に加工・編集する必要があります。そのためのシステムが、ETL (抽出:Extract, 変換:Transformation,書き込み:Load)システムです。ETLシステムは、次のような処理を行います。
- 【不要なデータの削除】分析では不要なデータや異常なデータについて削除する。
- 【値の変換】Null値の変換や、データ型の変換(日付→文字列など)を行なう。
- 【クレンジング】システム間でコードの意味が違う場合にそれを統一するなど、データの意味をそろえる。また、データ内に不整合があった場合にそれをエラーとしたり、一定のロジックで変換したりする。
- 【統合・集計】 複数のシステムから抽出した別のデータを1つのデータとして統合する。また、たとえば業務システムでは日単位のデータを月単位に集計するなどの集計処理を行なう。
ELTシステムによって加工編集されたデータは、DWHに書き込まれます。このDWHは、次のような特徴を持っています。
- 【項目別】基幹システムは「機能別」に設計されており、データには「目的」がある。DWHでは、これを項目(サブジェクト)毎に再構成する。
- 【統合化】様々なシステムからのデータを一つに統合するために、データフォーマットの変換や抽象化などを行う。
- 【非更新】データの修正があった場合でも、古いデータを削除したり、上書きしたりせずに、追記し、履歴を完全に残す。
- 【時系列】データを上書きせずに追記していくことによって、過去のある時点でのデータを参照できるようにする。
なお、多くの業務機能を統合したERPパッケージの中には、業務処理とBIアプリケーションでの使用を同一のデータベースで行おうという製品もあり、その場合は、ETLシステムは不要となり、DWHもERPシステムのデータベースに統合されています。
DWHのデータは、BIアプリケーションによって処理されます。その際、解析の目的に適合したデータや最適な解析手法、予測モデルを選択しなければなりません。また、解析の結果を解釈し、指示やアドバイスを導き出すことも必要です。この役割を担うのがデータサイエンティストです。
なお、この役割を人工知能に置き換えようという取り組みも行われており、IBMのWatson Analyticsなどは、そんな取り組みを行っています。
【最新版】最新のITトレンドとビジネス戦略【2015年7月版】
「最新のITトレンドとビジネス戦略を最新版に更新しました。
*新規ページを18ページを追加し、全292ページとなりました。
*最新の解説文を25ページ追加した。
・新たにERPの章を設け、18ページのプレゼンテーションを追加
・IoTおよびITインフラ(仮想化とSDI)に関するプレゼンテーションを一部改訂し、解説文を追加
・アナリティクスに関するプレゼンテーションを改訂し、解説文を追加
新入社員研修でご採用頂いています
「情報と処理の基礎は教えているが、クラウドやIoT、
ビッグデータは教えていません。」
そんなことで新人達が現場で戸惑いませんか?
平易な解説文と講義に使えるパワーポイントをセットにしてご利用
「【図解】コレ1枚で分かる最新ITトレンド」に掲載されている100枚を越える図表は、ロイヤリティ・フリーのパワーポイントでダウンロードできます。自分の勉強のため、提案書や勉強会の素材として、ご使用下さい。
目次
- 第0章 最新ITトレンドの全体像を把握する
- 第1章 クラウドコンピューティング
- 第2章 モバイルとウェアラブル
- 第3章 ITインフラ
- 第4章 IoTとビッグデータ
- 第5章 スマートマシン