Report on Japan's infrastructure topic on weekend.

非専門家向けのデータ分析ツール新潮流

»

ビッグデータの最近の状況をもっとも客観的にまとめていると思われる米オライリーの"Big Data Now 2013 Edition"(2014年2月刊行、無料でPDF版が入手可)。

これを読んでいると、ビッグデータ分析関係のツールのカテゴリーに「非エキスパート向けツール」(Data-Analysis Tools Target Nonexperts)というのがあります。
非エキスパート向けツールとは、筆者Ben Loricaによると、1)プログラミングを必要としないもの、あるいは、2)コード、ビジュアル、テキストを統一的なワークフローで統合できるもの、ということです(同書p7)。
多くの場合、これらのアプリケーションは与えられたデータセットへの分析を自動化・支援しますが、ものによっては分析結果の「解釈」を支援するものもあるそうです。

オライリーのデータ専門ブログである"Data"セクションの常連専門ブロガーであるBen Loricaによると、データ分析のルーチン的な作業は、ほとんどプログラミングを必要としないツールによって、早晩、非データサイエンティストであるビジネス部門のアナリストによって行われるであろう。そうしたツール類の出現によって、データサイエンティストの役割は、異なるドメイン(ツール、言語、ビッグデータ・プラットフォーム)を横断的にハンドリングできることに特化していくのではないか、ということを記しています(同書p7の脚注)。


Ben Loricaが非エキスパート向けツールとして挙げているのが以下です。

DataHero

DataCracker

Statwing

BigML

Datameer

Platfora

ClearStory

Skytree

このうち、DataHero、DataCracker、Statwingは、ビッグではないデータの分析(特にコンシューマー関連の分析)を容易にするもので、一部に見られるオープンデータの分析サービスなどとも近しい領域にあります。手近で得られるオープンデータを入れて試してみるのにもよさそうです。

1つひとつのツールがユニークな特徴を持っているようで、細かく説明を読み込んでいくと興味が尽きません。DataHeroには、人口のセグメント別の分析に重宝するコーホート分析を著しく容易化する機能があったりします。また、DataHeroのデモ的なデータ分析の説明ブログでは、映画業界のデータを様々な切り口で分析しながら、「間もなく女性ヒーローの映画の時代がやってくる」という結論を導きだしています。これも一種のPredictive Analysisでしょう。このデモのページでは、Google Driveを介して元となったデータの提供もなされています(末尾)。

この関連、もう少し追いかけてみようと思います。

Comment(0)

コメント

コメントを投稿する