2013年ビッグデータビジネスとデータサイエンティストのまとめ
2013年はビッグデータビジネスが本格的に立ち上がり始めた年でした。一方で、データ分析に対応できるデータサイエンティストの深刻な人材不足が指摘された年でもありました。
2013年のビッグデータビジネスの動向と、データサイエンティストの状況について焦点をあてて整理してみたいと思います。
ビッグデータによるGame Change
アメリカは構造的な問題の打開には成長志向の政策と投資の活発化、雇用の促進が必要とし、シェールガスと石油産業、貿易促進、インフラ投資、ビッグデータの分析と教育改革の5つの分野における大規模な投資が必要と指摘しています。
ビッグデータによる小売りやサプライチェーン・マネジメント、製造業の合理化の推進、政府の医療コスト負担を抑制など、経済効果は、1550億ドルから3250億ドルと推計するなど、経済効果が期待されています。
ビッグデータビジネスの成長性
2012年の国内ビッグデータテクノロジー/サービス市場は、206億7,000万円。2012年~2017年は年間平均成長率37.5%で拡大、2017年には1,015億6,000万円に達すると予測しています。
普及を阻害する要因として、投資対効果が見えにくいとの指摘があり、ビッグデータの活用を促進には、構造化、非構造化データに関わらず、アナリティクスソリューションの普及が不可欠としています。
適用分では、2015年度までは企業内でのデータ活用が中心となり、2017年度以降はより公共性の高いスマートシティなど社会インフラを支えるデータ基盤としての活用が期待されています。
公共性の高いビッグデータとオープンデータとしてまとめたのが以下の図です。
ビッグデータビジネスを取り巻くプレイヤーとビジネス相関
ビッグデータビジネスによるエコシステムを形成していくには、以下のプレイヤーがそれぞれの強みを活かし、Win-Winの関係構築し、収益をあげるためのエコシステムを形成することが重要となります。
Data Consumer | ビッグデータを活用したサービス(分析結果等)の利用者および組織に属する管理者 |
Data Provider | ビッグデータを保有し、第三者に提供する事業者 |
Data Broker | Data Provider間のサービス提供や契約締結の仲介者、データマーケットプレイスの提供者(BlueKai等) |
Data Integrator | データを活用したデータ分析による意思決定支援を行う事業者 |
Data Service Enabler | ビッグデータを活用したプラットフォーム環境を構築するための必要なIT製品、ソフトウェア、クラウドサービスの提供者 |
Data Auditor | データのプライバシー、著作権、個別法などのアセスメント(評価)を行う第三者機関となる組織 |
ビッグデータによるエコシステムの相関をまとめたのが以下の図です。
今後、注目されていくのは、データを活用した分析による意思決定支援を行う事業者でデータサイエンティストの役割などが注目されています。
データサイエンティストの視点で各社のビッグデータ関連ビジネス
ビッグデータの活用にあたって、大きく分けるとIT事業者がデータサイエンティストをユーザ企業に対してコンサルや分析をするパターンと、ユーザ企業自身が自社内でデータサイエンティスト、または、それに近い分析官を配置し、分析するパターンが見られます。
http://www.nikkei.com/article/DGXNZO57421630X10C13A7EA1000 等から加工
IT事業者の場合は、アクセンチュアや富士通、NEC、日立製作所などが100名前後の規模のデータサイエンティスト、または、分析官を抱えています。それぞれ出身が、研究者、開発者、コンサルタントなど多岐にわたっています。
また、ビッグデータ関連の組織では、業無の内容も戦略の立案、コンサル、解析、運用、シナリオ設計、リスク管理、アプリや運用ツールの活用、分析基盤構築など幅広い分野となっています。
IT事業者はビッグデータの組織をつくりながらも、様々な人員を配置し、様々な業務を通じて、ビッグデータビジネスの独自モデルを創りだそうと力をいれているところが伺えます。
次にユーザ企業を見てみましょう。
ユーザ企業の優良事例として紹介されるのが、大阪ガスです。大阪ガズではビジネスアナリシスセンターで10名規模での数理計画、統計解析、環境、気象、エネルギーなどの専門家を抱え、業務の改善や意思決定に直結する分析などを行っています。
ユーザ企業では、マーケティングなどにビッグデータ活用を利用するケースが多いのですが、東芝の場合は、半導体生産の効率化のため、ライン設計、搬送、生産の3つのデジタルシュミレーションを行うことで、効率化を進めています。
面白いのはマスターカードの事例です。マスターカードはマスターカード・アドバイザーズが650億件の取引データを収集して分析し、ビジネスと消費トレンドを予測しています。その予測データを外部に販売しています。将来的には、カードの手数料ではなく、このトレンド予測データの販売収入が、事業の大きな利益を占める可能性もあるでしょう。
以上のように、IT事業者はユーザの多岐にわたるニーズに対応するために様々な人材を配置し、幅広い事業領域に対応できる体制をとっています。一方、ユーザ企業の場合は、業務にあわせて手段の一つとして分析を行っているというケースがみられます。
データサイエンティストとは?
そもそもデータサイエンティストは
データサイエンティストとは、
統計学、機会学習、プログラミングや可視化といったビッグデータ分析に高度なスキルを有し、データの分析や解析結果を新たな知に結びつけ、効果的なマーケティングや需要予測モデルを導き出し、経営者の視点でマネジメントの意思決定に使える提案を行い、ビジネスの課題を創造的に解決するとともに、新たな知見による現実の成果につなげていける人材である。
と定義しました。
データサイエンティストとその他の人材構成をまとめたのが以下の図です。データサイエンティストは、高度で幅広いスキルや知識、そして、コミュニケーション能力が求められています。
データサイエンティストの資質(能力)、業務例などについてまとめたのが以下の図です。
データセットのアナリティクスを活用できる人材が世界で150万人不足
世界におけるデータサイエンティストの人材不足も深刻です。2011年5月に米マッキンゼーが公表した「McKinsey Global Institute「Big data: The next frontier for innovation, competition, and productivity」によると、米国では2018年までに、高度なアナリティクス・スキルを持つ人材が14万~19万人不足で、大規模なデータセットのアナリティクスを活用し意思決定のできるマネージャーやアナリストが150万人不足すると算出しています。
McKinsey Global Institute「Big data: The next frontier for innovation, competition, and productivity
ビッグデータ関連の意思決定や人材不足感や予算やリソースの不足が顕著に
EMCが、2011年12月に公表した「New Global Study EMC」によると、ビッグデータとデータ分析の連携により生み出されるビジネス・チャンスを利益に結び付けるために企業で必要とされるスキルが世界的に不足していると指摘しており、ビッグデータ関連の意思決定や人材不足感や予算やリソースの不足が顕著となっています。
統計学や機会学習の経験を持ちデータ分析ができる大学卒業生が減少する日本
一方、統計学や機械学習に関する高等訓練の経験を有し、データ分析に係る才能を有する大学卒業生数は、米国の2万4,730人、中国の1万7,410人、インドの1万3,270人、日本は3,400人となっており、その他先進国と比べても低い数値となっています。
大学や大学院で統計学、もしくはそれに類する専門分野を学ぶ人材が欧米に比べて圧倒的に少ないことが原因
McKinsey Global Institute「Big data: The next frontier for innovation, competition, and productivity」2011.5
日本の大学では、統計学部や学科がほとんど存在せず、各学部の履修科目の一つに過ぎず、統計学や機会学習やそれに類する専門分野を学ぶ人材が欧米と欧米諸国などを比べると、圧倒的に少ない状況となっています。
世界におけるデータ分析の才能を有する人材の推移
中国は年率平均10.4%の成長率でデータ分析の才能を有する人材が増加するなど諸外国が増加傾向にあるのに比べ、日本は年々減少(平均-5.3%)しています。
McKinsey Global Institute「Big data: The next frontier for innovation, competition, and productivity」2011.5
データ分析スキルを持つ専門家の需要は今後8年間で24%増加
米労働統計局によると、ビッグデータの増大により、今後8年間でデータ分析スキルを持つ専門家の需要は24%増加すると予測しています。
The U.S. Bureau of Labor predicts a 24 percent increase in demand for professionals with data analytics skills during the next eight years
http://www-03.ibm.com/press/us/en/pressrelease/41733.wss
日本では25万人が不足
「Gartner Symposium Report:201x年に情報システム部門はどうするべきか?」によると、企業の情報システム部門が受け持つIT予算は次第に減少し、2015年にはIT支出企業のIT支出の35%がIT部門の予算外となり、2017年にはマーケティング部門が行使できるIT予算が情報システム部門を上回ると予測しています。
さらに、日本では、ビッグデータ関連の雇用が36万5000人分増える見込みに対して、実際に雇用条件を満たせる人材は11万人程度となり、25万5000人が不足することになります。
Gartner Symposium Report:201x年に情報システム部門はどうするべきか?」
50%を超える企業はデータサイエンティスト不在
企業では、データサイエンティストの配置不在が顕著で、57.1%の企業でデータサイエンティストが不在となっています。
データサイエンティストが所属する部門では、IT部門(41.6%)部門がもっとも多く、経営企画部門(24.7%)、マーケティング部門(18.0)と続いている。データ分析専門部署は9.0%にとどまっています。
政府も育成支援するデータサイエンティスト
政府もデータサイエンティストの育成について政策的な支援を検討しています。2012年7月に公表した「日本の再生戦略(科学技術イノベーション・情報通信戦略 )クラウド等を通じたデータ利活用による競争力確保のための環境整備」において、2013年度までに実施すべき事項として、データサイエンティストの育成をあげています。関連市場創出に向けてのデータサイエンティストの育成も重要施策としてあげています。
http://www.cao.go.jp/sasshin/kisei-seido/meeting/2011/subcommittee/120803/item5_2.pdf
不足するデータサイエンティスト育成のための様々な育成支援プログラムの取り組みが進められています。
文部科学省次世代IT基盤構築のための研究開発「ビッグデータ利活用のためのシステム研究等」採択課題では、「ビッグデータ利活用によるイノベーション人材育成ネットワークの形成」によるデータサイエンティスト育成ネットワークの形成、「ビッグデータ利活用によるイノベーション人材育成ネットワークの形成」によるスキルと実践を重視したビッグデータ・イノベーション人材育成プログラムの取り組みを行っています。
文部科学省大学間連携共同教育推進事業の文科省大学間連携共同教育推進事業「データに基づく課題解決型人材育成に資する統計教育質保証」では、具体的な分析の手順・方法と数理的基礎などの取り組みを実施し、東京大学、大阪大学等8大学、6学会(応用統計学会、日本計算機統計学会)、8団体(大学入試センター、日本科学技術連盟等)などが参加しています。
大学におけるプログラムもご紹介しましょう。
ビッグデータを活用した新しいビジネスモデルやユースケースの提案を最終目標とした事業支援をEMCが実施しています。会津大学ではベンチャー基本コースでビッグデータの買う超事例や効果、データ活用手順、分析手法などのレクチャーを行っていいます。
海外では、ヴァージニア大学のビッグデータ・インスティテュート(Big Data Institute)や、コロンビア大学のビッグデータに関する新しい修士コースの定量分析学(Quantitative Studies)などを行っています。
米国では、データサイエンスに関わる学科のページを開設しています。
コロンビア大学(Institute dor Data Sciences and Engineering)
ニューヨーク大学(Data Science at NYU)
企業におけるデータサイエンティスト育成プログラムも始まっています。EMCジャパンでは、データ・サイエンティストトレーニングコース「Data Science and Big Data Analytics」を実施し、基本から応用的な分析方法の知識や、分析に関する技術とツール、分析結果の表現方法など、データ・サイエンティストとしての実務内容を網羅しています。
2013年7月16日には、「一般社団法人データサイエンティスト協会」が発足し、データサイエンティストに必要となるスキル・知識を定義し、育成のカリキュラム作成や評価制度の構築などを行っています。
http://www.datascientist.or.jp/
2013年9月19日には、慶應義塾大学SFC研究所、アクセンチュア、ブレインパッドにより「データビジネス創造・ラボ」を創設し、ビッグデータの集計・解析手法に関する共同研究や、データサイエンティストの育成や教育カリキュラムの立案を行っています(ニュースリリース)。
学生を中心としたデータ分析コンテストも開催される予定です。実務で統計・データ分析を行う社会人ならびに統計学や情報学一般に関心を持つ学生の方々を対象に、分析アイデアおよび分析スキルの優劣を競うコンテスト「データサイエンス・アドベンチャー杯」が開催されており、12月6日現在で85チームがエントリーしています。
日本におけるビッグデータ解析における人材・スキル不足は顕著となっており、特に、データ解析を学ぶ卒業生は日本は減少傾向にあります。政府や企業なども支援プログラムも海外と比べると見劣りが見られます。
ビッグデータに関する事例は増えてきつつあるものの、各企業においても多くはデータサイエンティストは不在となっています。
2014年以降にビッグデータ関連ビジネスが本格的に立ち上がっていくにあたっては、関連事業者のエコシステムの形成とともに、データサイエンティストを始めとした人材育成が急務となっていくでしょう。