DX解説(30)データの収集、加工・精製、蓄積、分析、利用、そしてデータの負債化をふせぐ
DXの推進にあたっては、データ活用が重要な手段の一つとなります。
データ活用の目的を決め、その準備を行うことがポイントとなります。
データ活用の準備には、必要なデータを集め、それらを活用 可能な形式に直す必要があります。
また、正しくデータを扱うための管理や運用体制を作ることも重要となります。
データを収集し、加工・精製、蓄積、分析、そして、利用と、データ活用のためのライフサイクルを回していくことではじめて、データを利活用できる状態となります。
出所:経済産業省 デジタルトランスフォーメーションの加速に向けた研究会 中間とりまとめ 2020.12
データを活用したい領域においてデータを集め、データが存在しない場合は新たに収集可能な手段を構築する必要もあります。
また、活用領域の拡大のためにばらばらに管理されているデータをまとめる場合もある。
部門間やグループ間の散財するデータ、サイロ化するデータを統合していくことがデータを活用する上で重要なポイントとなります。
出所:経済産業省 デジタルトランスフォーメーションの加速に向けた研究会 中間とりまとめ 2020.12
収集したデータには精製・加工と呼ばれる処理が必要となります。
外れ値や異常値の除去(データクレンジング)や、複数テーブルを統合する際の関連データの紐づけ(名寄せ)、同じ意味をもつデータの表記を統一するなど、
データを活用目的に合わせて適切な形に変換します。機会判読可能なデータにしていく必要があります。
出所:経済産業省 デジタルトランスフォーメーションの加速に向けた研究会 中間とりまとめ 2020.12
加工したデータを蓄積する環境は、扱うデータの種類や量、活用用途を考慮した設計・選定を行います。
可能なところは自動化するなどメンテナンスのしやすい設計によって運用コストを抑え、アクセス権などセキュリティに関わるところは責任者を設置するなど、
システムと人材の両面で管理・運用体制を整えることが重要となります。
これらのプロセスを回していくためには、それぞれのプロセスに対応したツールを選定することもポイントとなります。
出所:経済産業省 デジタルトランスフォーメーションの加速に向けた研究会 中間とりまとめ 2020.12
一方、日々蓄積されるデータは膨大な量となる一方、活用されず価値の判断ができないまま保存されているデータはダークデータと呼ばれ、負債となり得る可能性もあります。
データを分類や構造化して仕分けを行い、価値のないデータは廃棄し価値のあるデータをきちんと活用するなど、将来的なコストを抑える取組みも必要となります。
出所:経済産業省 デジタルトランスフォーメーションの加速に向けた研究会 中間とりまとめ 2020.12
※経済産業省は「デジタルトランスフォーメーションの加速に向けた研究会 中間とりまとめ」(2020年12月28日)を公表しており、この資料からも適宜引用しています。