【図解】コレ1枚でわかるデータを取得する方法とデータの種類
「既に多くのデータの蓄積があるから、これを使って何かできないだろうか?」
そう考えるのは、自然なことです。しかし、現実には、「ほとんどのデータはゴミである」あるいは、「多くのノイズを含んでいる」と考えておいたほうがいいでしょう。また、蓄積された過去のデータだけでは、その活用に限界があります。"いま"をリアルタイムに捉えなければ、見えないこと、あるいは、ビジネスに活かせないことがあります。
まず考えておくべきは、データからゴミやノイズを排除することです。そのためには、「何を解決するために、何を知りたいのか」を決めた上で、必要とするデータ項目や取得の方法を決めなくてはなりません。そうしなければ、必要なデータが、不要なデータに紛れ込んでしまい、あるいは、バイアスがかかって、正しく事実を把握できなくなります。あるいは、必要とするデータ項目を網羅することができず、知りたいことが分からないことにもなります。既に蓄積してあるデータからノイズを取り除くだけでは、不十分な場合があるということです。
このようなことにならないためには、先ずは、「誰に、どのようなベネフィットを提供するのか」を考えることです。つまり、ビジネスのゴールと解決策を決めてから、必要とするデータの項目や取得方法を設計しなくてはなりません。
そのためには、業務担当とデータ分析担当が、ビジネスの要件と課題を共有することから始める必要があります。それを踏まえて、いかなるデータが、ビジネスの成果や進捗を評価するのに役立つのかを見極め、そのデータを取得するための適切な方法について仮説を立てます。そして、これをシステムに実装しなければなりません。
次に考えておくべきは、取得するデータの種類です。その分類方法は、ひとつではありませんが、属性データ、行動データ、生活データに分ける方法があります。
属性データとは、性別や年齢、既婚か未婚か、職業などの静的で固定的なデータです。取得した時点での事実を知るためで、Webからの登録やアンケートなどによって取得できます。
行動データは、場所や時間、体験や感動などの動的で変化し続けるデータです。スマートフォンに搭載されたセンサーやチャット、SNSへの投稿など、時々刻々変わる変化、すなわちいまの「状況」を知るためのデータです。
生活データは、属性データや行動データの蓄積と、その分析によって得られるデータで、主義主張、人生観、悩み、価値観、生活圏などです。
これら、異なる種類のデータを取捨選択し、あるいは組み合わせて、ゴールを達成するための知見や洞察を得ることができます。また、AI(機械学習)を組み合わせることで、これから起こる出来事を予測し最適解を見つけることや、適切な判断基準やルールを見つけて、業務プロセスを自動化することに使うことができます。
改めて、データを取得し、活用するための手順を整理すると次のようになります。
- ゴール、すなわち何を解決したいのかを決める。
- ゴールを満たすために何を知らなくてはならないかを決める。
- 「知らなくてはならないこと」を知るためのデータの種類とその項目を決める。
- データを取得する方法を決める。
- 取得したデータを分析する方法を決める。
- そのための業務プロセスを決め、システムとして実装する。
このような手順を踏み、また結果を見て改善を重ねながら、必要なデータを確実に取得し、活用できるようにしなくてはなりません。