オルタナティブ・ブログ > シロクマ日報 >

決して最先端ではない、けれど日常生活で人びとの役に立っているIT技術を探していきます。

【Strata+Hadoop World 2015】「データサイエンスはチームスポーツである」

»

ということで、今年もオライリー主催のデータ系カンファレンス"Strata + Hadoop World 2015"にやって来ました。今年から春のStrataもStrata+Hadoop World扱いとなり、会場もカリフォルニア州サンタクララのコンベンションセンターから、サンノゼのコンベンションセンターへと移動しています。

Hadoop Worldとの併設になったという関係もありますが、サンタクララの会場よりも広くなり、参加者も一回り多くなった感じ。このカンファレンスを取り仕切る一人である、O'Reilly MediaのRoger Magoulasさんも、キーノートの前説で「5年前は小さなイベントとして始まったけど、たった5年でここまで大きくなったことに驚き。5年前はツール系の話がほとんどだったのが、現在ではアプリや周辺テーマに関する話も多くなった」と語っていました。

実はキーノートでちょっとしたサプライズが。ビデオコメントという形でしたが、オバマ大統領が簡単なスピーチを行ったのです。

ちょうどYouTubeでも公式映像が公開されたので、埋め込んでおきましょう:

実はキーノートに登壇されたDJ Patil氏(「21世紀にはデータサイエンティストがセクシーな職業になる」という発言で有名ですね)が、米連邦政府初のチーフ・データサイエンティスト(!)に任命されたということで、オバマ大統領からのコメントをもらってきたようです。ちなみにこの就任に関するWiredの記事がこちら:

White House Names DJ Patil as the First US Chief Data Scientist (Wired)

It’s finally official: The White House has named DJ Patil its first ever Chief Data Scientist and Deputy Chief Technology Officer for Data Policy.

Yes, that’s a mouthful. Even as an acronym, Patil’s new title is ten letters long: CDSaDCTODT. But the gist is that Patil—who has worked inside several big-name Silicon Valley operations, including LinkedIn, eBay, PayPal, Skype, and venture capital firm Greylock Partners—will now act as an evangelist for new applications of big data across all areas of government, with a particular focus on healthcare.

President Obama recruited him personally, and Patil will work in the Office of Science and Technology Policy, reporting to US Chief Technology Officer Megan Smith.

ホワイトハウスが米連邦政府初のチーフ・データサイエンティスト兼データ政策担当次席技術官として、DJパティルを任命したことが明らかになった。

まったく長い肩書きだ。頭文字を拾っても、CDSaDCTODT(Chief Data Scientist and Deputy Chief Technology Officer for Data Policy)になってしまう。要はこれからパティル(リンクトインやイーベイ、ペイパル、スカイプ、グレイロック・パートナーズといったシリコンバレーの有名企業で活躍してきた人物)が、ビッグデータ活用のエバンジェリストとして、連邦政府全体に対して働きかけていくということだ。特にフォーカスしているのは、ヘルスケアの領域である。

この就任はオバマ大統領の個人的な働きかけによって実現したもので、パティルは今後、科学技術政策室で働き、連邦政府の最高技術責任者(CTO)であるミーガン・スミスが上司となる。

ということで、個人的なつながりによって実現したのですね。オバマ大統領のスピーチの中でも、パティル氏の今後の活躍に期待するとのコメントが寄せられていました。またWiredの記事ではヘルスケア部門が最初に取り組む領域だとされていますが、パティル氏のキーノートでは、最優先する分野として「精密医療(Precision Medicine)の支援」「(連邦政府が公開しているオープンデータを活用した)データプロダクトの開発」「責任あるデータサイエンスの推進(プライバシーの保護など)」の3つが掲げられていました。

そして何より、パティル氏とオバマ大統領の2人が強調していたのが、「データサイエンスはチームスポーツである(Data science is a team sport)」という言葉。データ駆動型(Data Driven)な政府を実現するためにはより多くの人々に協力してもらわなければならない、そのためにU.S. Digital Serviceに参加してほしい、と会場に訴えてスピーチを終えていました。

実際、「データサイエンスに関して何でもできるスーパーマンを探す」というアプローチはとっくの昔に現実的でないとして、個々の専門領域を持った人々を集めた「データサイエンス・チーム」をつくって対処する、というアプローチの方が主流になっています。今回のStrata+Hadoopでも何度かこの点に触れられているのですが、同じくキーノートに登壇された、クラウデラのAmr Awadallahさんによるスライドもそれを端的に示しているでしょう:

カンファレンス名にも「Hadoop」という単語が入ってるわけですが、HadoopってもはやHadoopのことだけじゃないよね、と複雑化する技術を挙げています。テクノロジー周りだけでなく、ビジュアル化やストーリーテリングといった要素(あるセッションでは「データサイエンスチームにはジャーナリストのスキルを持つ人物を含めるべき」というアドバイスもありました)も含めれば、ますます少数の人物の力だけでは実現できない世界になっていると言えるでしょう。まさに「データサイエンスはチームスポーツ」なわけです。

それを象徴するように、会場を訪れた人々のバックグラウンドも、技術系からアカデミック系、ビジネス系と多岐にわたっています。もちろん彼らがそれぞれの専門知識を掘り下げているだけではだめで、一定の共通認識や知識を基に、どこまでチームワークを発揮できるか。あるいはチームの外にいる関係者たちとも良い関係を築き、彼らを巻き込むことができるか。その辺りが、データ活用の高度化を進める上で欠かせないテーマになってきています。

Comment(0)