オルタナティブ・ブログ > シロクマ日報 >

決して最先端ではない、けれど日常生活で人びとの役に立っているIT技術を探していきます。

ビッグデータがジャーナリズムを生む日

»

近著『グーグル ネット覇者の真実』も話題を集めたスティーブン・レヴィ氏が、WIREDに非常に面白い記事を寄稿しています。邦訳もいずれどこかに掲載されるはず、というよりして欲しい内容:

Can an Algorithm Write a Better News Story Than a Human Reporter? (Wired)

「アルゴリズムは人間の記者より優れた記事を書けるか?」というタイトルなのですが、もちろん現時点でロボット記者のような存在が実現しているわけではありません。しかし現実は、私たちが想像しているよりもはるかに先へ進んでいることが語られています。

実際にどれほどの記事を自動生成できるまでに達しているのか。文中の例を引用してみましょう:

Friona fell 10-8 to Boys Ranch in five innings on Monday at Friona despite racking up seven hits and eight runs. Friona was led by a flawless day at the dish by Hunter Sundre, who went 2-2 against Boys Ranch pitching. Sundre singled in the third inning and tripled in the fourth inning … Friona piled up the steals, swiping eight bags in all …

今週月曜日にフライオナで開かれた5回制の試合で、フライオナは7つのヒットと8点を奪ったが、ボーイズ・ランチに10対8で敗れた。フライオナはハンター・サンダーが辛抱強いピッチングを行い、ボーイズ・ランチ相手に2対2と粘っていたが、3回に一塁打、4回に三塁打を浴びた……フライオナは盗塁を重ね、合計で8点を奪った……

一読すれば明らかですが、これは野球、それもリトルリーグの試合について報じたもの。野球に関する特有の表現も使われていて、非常に「それらしい」記事にまとまっています。ネイティブの人が読んだらまた違った印象を受けるのかもしれませんが、試合の様子を把握することは十分に可能であり、ここまで出来るならすぐにでも「ロボット記者」を雇いたいというローカルメディアもあるのではないでしょうか。

ではいったい、どのような技術でこれを実現したのか。記事ではNarrative Scienceという企業が紹介されているのですが、同社のキャッチフレーズは「データを物語と発見に変える(We Transform Data into Stories and Insight)」。つまり試合に関する様々なデータを収集、それを独自のアルゴリズムに投入することで記事を生成するわけですね。

マイケル・ルイスの『マネー・ボール』を引き合いに出すまでもなく、野球は様々なデータから計測・分析することが可能なスポーツです。どのようなデータを集めれば良いか、どう集めれば良いかについては既に確立された方式があり、それに従えばある程度まで試合全体をデータに置き換えることができます。実際に先ほどの記事は、試合を観戦していた親たちがiPhoneアプリ経由で入力したデータを基に生成されたものであるとのこと。しかも試合終了とほぼ同時に記事が出来上がっていたそうです。

というわけで、汎用的にどんな記事でも書いてしまうロボットができたわけではなく、あくまでも野球といった特定の状況で、あらかじめ与えられたデータを基に記事を生成するシステムができたという話。文章表現についても、本物のジャーナリストにお願いしてテンプレートを作ってもらったのだとか。しかし特化型のプログラムにせよ、十分なデータさえ得られる領域ならば、同じように記事を書かせることができる可能性があります。実際にこの技術は、他のスポーツやファイナンスといった分野への応用が進められているとのこと。

また仮に狭い範囲にしか応用できない技術であったとしても、それがもたらす可能性は大きいと言えるでしょう。例えばこのアプリを無料配布して、全米のリトルリーグやマイナーリーグで行われる無数の試合が記録できれば、「リトルリーグ・ニュースサイト」のようなものが低コストでできるかもしれません。データがベースになっているのなら、例えば「30年ぶりの珍プレー・好プレーが起きた」といったニュース性の高いネタを拾うのも簡単なはずです(過去の試合データが蓄積されていることが前提になりますが)。さらにある程度自動化できる分野はロボットに任せ、人間の記者はより社会性・重要性が大きなテーマを追うという役割分担もできるでしょう。

今年2月に米サンタクララで行われたビッグデータ系イベント"Strata 2012"の中で、「スポーツとAR」をテーマにしたセッションがありました。よくテレビのスポーツ番組で見られるような、実際のプレー映像と様々な統計データ・補足CGを合成するという技術を提供する企業・Sportvision社の関係者が登壇されたのですが、彼らが面白いことを言っていました。米メジャーリーグでよりAR的な手法を可能にするために、試合中のあらゆるデータを自動的に記録する(カメラやセンサ類などで)仕組みを開発、導入を進める計画なのだそうです。いろいろと政治的・感情的な理由もあって(映画版の『マネーボール』をご覧になった方なら想像がつくでしょう)、一筋縄ではいかないそうなのですが、実現すればスポーツジャーナリズムにとっても画期的な一歩となるでしょう。そこで収集されたデータを前述のようなアルゴリズムにインプットすれば、ゲームセットと同時にたちまち記事の一丁上がり、になるわけですから。

そしてビッグデータの取り組みが今後様々な分野で進められてゆけば、ロボット記者が活躍する領域も広がってゆくはずです。過去の統計データが参照できるような領域であれば、人間の記者が気付かなかった状況変化や、将来の状況変化の予兆を読み取って記事にするといったケースも生まれてくるかもしれません(何しろネット上の情報からインフルエンザの流行や将来の株価が把握できるぐらいですから)。もちろんそれがジャーナリズムの全てになり、人間の記者が一切いらなくなるという事態が起きる可能性は低いでしょう。しかし例えば、先ほどのような試合終了と同時の速報はロボットに任せ、人間は時間をかけて選手一人ひとりの心理描写を駆使した記事を書く――などというという補完関係を実現するマスメディアがいずれ登場してくるのではないでしょうか。

グーグル グーグル ネット覇者の真実 追われる立場から追う立場へ
スティーブン・レヴィ 仲達志

阪急コミュニケーションズ 2011-12-16
売り上げランキング : 1501

Amazonで詳しく見る
by G-Tools

【○年前の今日の記事】

エイヤフィヤトラヨークトル氷河の火山噴火で、マドリッドに1週間足止めされていた件 (2010年4月27日)
ITでローカル体験 (2006年4月27日)

Comment(1)