オルタナティブ・ブログ > なるいのDRM進化論 >

デジタルコンテンツ流通の潮流を見据えて

絶対計算ってなんだ。Super Crunchers「その数学が戦略を決める」を読む。デジタルコンテンツの行き着くところ。

»

Ian Ayres(イアン・エアーズ)著、山形浩生訳、文春春秋社 「その数学が戦略を決める」”Super Crunchers"が文庫本で出たのを機会に読む。いわゆるデーターマイニングである。Amazonの内容説明によると、

内容紹介 エール大学の気鋭の計量経済学者がわかりやすく書いた知的大興奮の書! 未来のワインの値段を決め、症状から病気を予測し、最適の結婚相手まで決める「絶対計算」とは? 一兆のデータが生む新世界秩序!

内容(「BOOK」データベースより)
ふたつの集合の、一見まったく違う要素の相関関係を計算していくことで、直感ではわからなかった意外な事実が浮上してくる。クレジットカードの返済の遅れの回数と、そのひとが車で事故を起こす確率。買い物履歴と離婚率。ぶどうを収穫した年の降雨量と、そのワインがビンテージとなって出荷された時の値段。技術革新が兆単位(テラバイト)のデータの集積を容易にしたいま、「絶対計算」はありとあらゆる事象の計算をしようとしている。最新医学データの集積による治療法の提示、性犯罪者の保釈を認めるべきか否か?どの政策がもっとも有効か?そうした時代に専門家の役割はどうかわるのか?個人の自己防衛の方法は?技術革新が生んだ新しい波「絶対計算」を知らずして、今を語るなかれ。

コンピュータ技術とネットワーク技術の発展により従来では想像もできなかったような膨大な量のデーターを得ることができるようになり、それを瞬時に解析(データーマイニング)できるようになったことによる、恩恵と弊害と期待と危惧を冷静に説明した本。2007年の脱稿で、それから今日までこの分野はさらに技術進歩が目覚しい分野であるにも関わらず、今でも、新鮮な驚きと示唆に富んでいる。

今後、音楽、雑誌、書籍などデジタル化されたコンテンツは急激な勢いで増加する。従来のアナログ媒体(物理媒体)をベースにしたコンテンツが電子データで消費されるビジネスになるということは、単に媒体が変わると言う事以上の変化をもたらす。コンテンツの形態は従来のようなまとまった一つの形式を持ったものから、細分化され、文字通り雲のようにクラウド上に漂うといった感じになってくる。iTunes Music StoreがCDをバラバラにして曲単位で販売し、雑誌や新聞は記事単位のビジネスを模索している。

絶対計算者、Super Crunchersはこの膨大なデータを分析することであらゆる意思決定の質と速度を高めることができる。Netflixはデータを独自のアルゴリズムを使って分析し、ユーザーに映画を推薦し、eHarmony(婚活支援サービス)は最良と思われるパートナーを選びだす。手法は昔からある回帰分析をベースにしたものだが、扱えるデータ量と計算能力が桁違いになったことで単なるシミュレーションの域を超えて実際の現象に近い結果を導き出す。

本書にはたくさんの興味深い事例が紹介されているのだが、一番面白くデジタルコンテンツビジネスに関連するのが、ハリウッドで映画を制作する際に、台本を分析して興業収入を最大化するということを実際にやっているということだ。台本の中で使われる言葉やシチュエーションに一定の加重を与えて全体のストーリーが観客の満足度を上げる値を求めるらしい。もちろんそのアルゴリズムと重み付けの詳細は秘密にされているが、結果は十分に正確でいくつかのスタジオが秘密裏にそのサービスを使っているらしい。

ということは、同じ手法である出版物が売れるかどうかをかなり正確に事前に推測することができるということだ。タイトル、登場人物とその名前、ストーリのプロットと言った基本メタ情報だけでなく、実際の数百ページの書かれたコンテンツから言葉を抽出し分析する。そのデータを過去にヒットした他の作品と比較することで、販売額を予想することができる。これらの作業は出版社の編集者が個人の経験と直感で判断して来たことだし、今でもそのように行われているのだろうが、可能性として、Super Crunchersはこれらの作業を個人からシステムに移管することができるということだ。もちろん、出版社の有能な編集者は「そんなことができるものか」と反論するわけで、ハリウッドでも映画製作者達から猛烈な反論にあったらしいが、実際に使ってみると間違いなく興業成績があがることが証明されてしまうので、秘密裏にこのサービスを使っている映画会社が複数あるらしい。

コンピュータが小説を書くのではなく、書かれた小説が売れる可能性を数値で判断するということで、作家も出版社もそう目くじらを立てて反論することでは無いと思うのだがいかがだろうか?

実は今回書きたかったことは、ここから先なのだが、もうすでに長文になってしまったので、続きは次回で。

Comment(3)