データマイニングとデジタルコンテンツ。「玉石混交、でもほとんどが石」の世界が訪れている。(前回の続き)
前回は巨大なデーターを高速なアルゴリズムで回帰分析する絶対計算者(Super Crunchers)について述べた。出版系のコンテンツがデジタル化されて流通されるようになると、Super Crunchersにとっては垂涎のデータが提供されることになる。これまでのスーパーの売上データや交通事故の記録だとかの事実だけの集積ではなく、文章となって抽象的または具体的な意味を持った文章が膨大な量で集積されることになる。これはSuper Crunchers達にとって果てしない宝の山となるかも知れない。
問題はそのデータは全くの玉石混交だと言うことだ。玉石混交と言うと玉と石が半々に混ざった状態のように聞こえてしまうが、実際には90%の石の中に10%の玉が存在するといった状態だ。いや、突き詰めると99%の石と1%の玉かも知れない。ただし、それらがデタラメであったり、意味の無いものであったり、または他人のコンテンツを複製したものであったりしてもデータはデータだ。もともとデータマイニングとは一つ一つのデータの意味を問うものではなく、集積されたデータから意味を紡ぎ出すものなので、出版系のデジタルコンテンツの総和が大事なのだろう。
Super Crunchersがそのデータから何を発見するかは別にして、デジタルコンテンツの世界というのは本質的にこのようにノイズが大量に紛れ込むリスクを抱えている。世界が今の勢いでネット社会となり、より多くの人が発信者としてコンテンツをネットに大量に注ぎこむことになると、そういったノイズの割合は幾何級数的に増えていくだろう。ほんのつい10年前までは、コンテンツの発信が物理的にも経済的にも制限がされていて、社会の仕組みとして自動的にそういったノイズが入り込む余地が少なかった。そういったタガが外れた今日ではもうだれもそれを止めることができない。先進国ではすでに十分ネット社会になっていると考えがちだが、そんなことはない。まだ日常的にネットに繋がっていない人の方が多いし、繋がっていても自らコンテンツを発信している人の割合は少ない。ここ数年SNSが急激に普及し、FacebookやTwitterに代表されるツールに億の単位の人がつながり、何がしらの発信を行い始めたところだ。これが更に広がり、世界的には中国やインドの人々が発信を始めることを想定すると、現在はまだまだ変化の始まりに過ぎない。
玉を作り出しそれをビジネスにしようとする場合、自らを世界に広がる99%の石から差別化しなくてはならない。注意を怠ると瞬時に玉は石の中に埋もれてしまい、誰にも発見されないか、発見されても従来とは比較にならない低価格でしか売ることができなくなってしまう。音楽はすでにそういう状態になりつつある。音楽の世界ではノイズとしてCDからのリッピングされたコピーがあげられる。これを違法と言い切ることはできないが、間違いなくこれがノイズとなって、正規のコンテンツの流通を意味の無い(少ない)ものにしてしまっている。コピーされたコンテンツはデジタルの場合、正規コンテンツと同じ品質を持ったものなので、玉も石も区別がつかない状態だ。この中で正規だからと言って従来通りのビジネスを期待することはできない。
出版系の話に戻ると、雑誌や新聞または実用書などは音楽に近い動きをするのではないかと思う。それぞれ、これまではまとまった物理媒体として価値を持って流通されていたが、早晩、音楽CDがあっという間に分割されてしまったように、多くのものが記事単位でばらばらに流通することになるだろう。そしてそれらはあらゆるところで複製されネット上に雲のように広がっていく。その中で、玉を持つ作家または出版社がどのようなビジネスをしていくのか、それが問われている。