オルタナティブ・ブログ > インフラコモンズ今泉の多方面ブログ >

株式会社インフラコモンズ代表取締役の今泉大輔が、現在進行形で取り組んでいるコンシューマ向けITサービス、バイオマス燃料取引の他、これまで関わってきたデータ経営、海外起業、イノベーション、再エネなどの話題について書いて行きます。

時価総額を5倍に増やしたNetflixの驚くべきビッグデータ経営(1) - ストリーミングへの業態転換が奏功

»

Netflixの存在感は日本ではいまいちピンと来ませんが、インターネットトラフィックの著名な調査会社Sandvineによると、米国のピーク時間帯におけるトラフィックの32%をNetflixのコンテンツストリーミングが占めているそうです。
2位は定番のYoutubeで19%(2013年11月)。

米国のインターネット視聴におけるNetflixの存在感は圧倒的と見て間違いなさそうです。彼らのビッグデータ活用を解説した記事によると、「最大手CATV会社HBOの地位に、HBOよりも早く上り詰めること」を経営の主眼としているとのこと。それを裏付けるように、どの資料を見てもアグレッシブな姿勢が伝わってきます。

業容は、2013会計年度の従業員数2,000名、売上高46億ドル、売上総利益13億ドル、純利益1億6,300万ドル、ストリーミング有料会員4,400万名、米国以外にカナダ、南米、欧州など40カ国で営業となっています。映画・ドラマのコンテンツの調達に年間20億ドルを投じており、これがもっとも大きな費用です。

なお、IT投資は年間3億5,000万ドル。一般的な米企業は売上高比3.5%程度が普通ですから、同社の8.3%は突出していると言っていいでしょう。テッキーな会社なわけです。
ものすごい動画配信インフラを持っていますし、アマゾンのクラウド(AWS)のヘビーユーザーでもあります。Hadoopは当然のことのように使っていますし、社内ユーザーのためのHadoop as a Serviceまで自社で作っています。さらにすごいのは、コンテンツ業界ではおそらく世界一と言えるビッグデータ分析を主軸にした経営を行っていることです。本投稿では2回に分けて、Netflixのビッグデータ経営とそれを支えるテクノロジー(クラウドのインフラなど)を見て行きます。

Netlix_logo

■勝つためにはビッグデータに取り組まざるを得ない

元々、定額制のDVD宅配レンタル会社だったNetflixは2009年頃から、PC、ゲーム機、スマートフォン、タブレット端末などに映画・ドラマのコンテンツをストリーミング配信する事業に力を入れ始め、2011年には営業の軸を完全にストリーミングに移しました。当初はもたつきもあって市場の評価を下げましたが、ビッグデータの活用による徹底的なデータドリブン経営に取り組んだ結果、2012年〜2013年の時価総額が50億ドルだったところ、現在では250億ドルを上回る水準にまで達しています

その間、米国証券市場がほぼ一本調子で上がってきたことを勘案するとしても、時価総額で5倍はやはりすごいと言わざるを得ません。その背景に同社のビッグデータ活用があります。関連資料をすべて読み込んだ上でまとめれば、同社の場合、有料動画ストリーミング配信で収益を上げるしか経営の選択肢はなく、他社に対する圧倒的な競走優位を獲得するには、独自の試行錯誤で切り開いたビッグデータ活用に頼るほかなかった。そのように推察できます。このすごみのあるビッグデータ活用が同社の特徴です。(セブンイレブンのデータ活用にも近いと言えるでしょう。)

■経営上の第1の課題:顧客をどうつなぎ止めておくか

まず、同社の経営上のポイントを確かめておきます。

主力サービスである有料動画ストリーミング配信は、月額7.99ドルで映画などのコンテンツが見放題。この顧客が4,400万名います。(DVD宅配レンタル事業はすでに例外的な顧客のためのものとなっています。)

同社の経営上の最大の課題は、まず、7.99ドルを払ってくれる顧客をどうやってつなぎ止めておくか。傍から見れば、月額会費を支払って何も見てくれない顧客が相当数いればコンテンツライセンスや配信インフラに払うコストも低くて済むし…などということを考えますが、同社では、毎月の視聴時間が一定水準を下回れば解約率が格段に増えるという事実をつかんでいて、1人ひとりの会員の月当たり視聴時間数をできるだけ増やすことが最大のテーマとなっています。

DVDレンタルから動画ストリーミングに移行する時期には色々な試行錯誤があったようですが、同社はある時期からユーザーの視聴時間を増やすには、アマゾンなどでおなじみのレコメンデーションが有効であるという事実をつかみ、その精度を上げるためのデータの収集、分析、仮説の立案と検証に日々取り組むようになります。
シリコンバレーの本社には800名のITスタッフがいて、そのうち相当数はデータアナリストだとのことです。(従業員2,000名のうち半分弱がITスタッフというのも、やはりすごいです) 
結果として、同社の毎月10億時間以上の総視聴時間のうち、75%はレコメンデーション由来のものとなっています。

彼らにとって、レコメンデーションの精度を上げることは死活問題です。ストリーミング専業と言ってもよい業態になった現在、売上向上、利益率改善のカギになるのは顧客のつなぎとめです(新規顧客獲得については後で述べます)。レコメンデーションがうまく機能しなくて、顧客がすぐに端末を離れてしまうならば、早晩解約という事態になります。それを避けるには、ありとあらゆるテクノロジーを駆使して、レコメンデーションをできる限り精度の高いものにしなければなりません。
そういう背景を踏まえると、これから述べる同社のビッグデータ活用の意義がよくわかってきます。Netflixにとって、勝てる道はビッグデータの活用しか残されていないのです。

事業の主軸がストリーミングという、すべてデジタルで完結するものになったことは同社にとって幸いなことでした。というのも、顧客行動のすべてがデータとなって同社に伝わってくるからです。DVDレンタルの時代であれば、取れるデータは、DVDカタログと店舗の役割を果たしているウェブサイト上での行動と、レンタル前後で取れる情報ぐらいに過ぎませんでした。顧客が自宅で行っている肝心の視聴行動については、何のデータも取れなかったわけです。
借りたけれども1週間放っておいて見ないまま返却したかも知れない。ある俳優の特定のシーンが好きで何度も繰り返し見たかも知れない。そういうことについては、まったくデータを取ることができませんでした。
しかし、ストリーミングサービスでは、視聴行動についてありとあらゆるデータを取ることができます。(これと同じことは、ネットやで完結する商行為のすべてについて言えます。)

■細かくデータを取り、数万の顧客クラスターに分類し、数万のジャンルからレコメンデーションする

Netflixでは、同じクラスターの顧客は、同じような映画・ドラマが好きだろうという大きな仮説をもって臨んでいます。その考えに基づけば、レコメンデーションの精度を上げるには、まず、顧客がどのようなクラスターに属するのか、分類を精密に行う必要があります。ということで同社が収集しているデータが以下です。

  • When you pause, rewind, or fast forward(いつポーズ、巻き戻し、早送りをしたか)
  • What day you watch content (何曜日にコンテンツを楽しんでいるか)
  • The date you watch(日付)
  • What time you watch content(視聴し始めた時間、終わった時間)
  • Where you watch (どこで見ているか、郵便番号やIPアドレスから)
  • What device you use to watch (どのデバイスで見ているか、TVからゲーム端末、スマホまで対応端末は100種類にわたる。また子ども用コンテンツはiPadで見ているといったコンテキストも大事)
  • When you pause and leave content (特定のコンテンツのどこでポーズをかけたか、視聴に戻ってきたか)
  • The ratings given (視聴後に顧客が付ける星1つ〜5つまでのレーティング、1日40億星とのこと)
  • Searches (顧客がサイト上で行うコンテンツ検索の内容。1日30億件)
  • Browsing and scrolling behavior(サイトのページのブラウジング状況、スクローリング状況)

同社の4,400万会員による総視聴時間は1ヶ月に10億時間。1日当たり3,300万時間の視聴、1人2時間として、1,150万人の視聴行動について、上記のようなデータを事細かに取っているわけです。
このデータ総量がどのくらいになるのか、しらみつぶしに探してみましたがわかりませんでした。しかし、同社の動画コンテンツの総量は3.16ペタバイトということで、それに比べれば1,000分の1、すなわち1桁テラバイト/日程度に収まるでしょう。とは言え分析する際には年単位のデータ量で回すでしょうから、かなりなビッグデータであることに違いはありません。

こうしたデータ分析により、「ボストン在住30代半ば女性会員Aは自宅のApple TVで平日に女性主人公のラブロマンスドラマを見るが、金曜夜にはジョニー・デップの出演作を順繰りに見ている」とか、「サンノゼ在住40代男性会員Bは自動車通勤している車上のスマホで、渋滞がひどい時には(スマホの移動速度が遅い)政界ドラマを流しっぱなしにする」といったことがわかってくるわけです。これによって判明した視聴行動のうち、有意な特徴を抽出し、彼・彼女が属するクラスター(複数)を決定するという流れになると思います。

クラスター数がどれだけあるのかわかりませんが、数千といったオーダーではないでしょう。数万程度にはなっていると思われます。

さて、レコメンデーションを行うには、個別クラスターが好んでみる映画・ドラマを把握しなければなりません。それも、特定作品というよりは、「クラスターXは、ジャンルYを好んでよく見る」といった形で、ジャンルをあてがう形にした方がレコメンデーションに普遍性が出ます。「クラスターXは、映画『ミリオンダラー・ホテル』を好んで見る」という分析結果では、クラスターXに対してレコメンできる映画はこれ1本しかありませんが、「クラスターXはジャンルYを好んでよく見る」という風に分析すれば、ジャンルXに複数の映画をぶら下げることができ、レコメンデーションで”撃つ弾”が増えます。実際に見てくれるかどうかは、レコメンデーションの精度を上げていけばよいだけです。

ということで、Netflixにとって次の仕事は、ストリーミング用コンテンツとして保持しているすべての映画、ドラマシリーズに対して、きわめて有用なジャンル分けを施すという作業になります。これにNetflixでは全力を挙げて取り組みました

映画・ドラマの中身を見ないことには分類も何もできませんから、まず、映画通・ドラマ通の外部スタッフを数十名雇い、36ページのマニュアルを作成して、タグ付け作業を標準化し、これらのスタッフに中身を見てもらって個別作品にタギングを施しました。そして1つの作品に付けられた複数のタグを、機械処理しやすいように、かつ、人が読んでも意味が通るように、「有意な文法性を持ったジャンル名」として生成し、10万〜20万作品と見られるすべての映画・ドラマコンテンツを7万数千件のマイクロジャンルに分類しました。

以下のようなジャンルができあがっています。

  • Movies directed by Otto Preminger(Otto Preminger監督の映画)
  • Dramas Starring Sylvester Stallone(シルベスター・スタローン出演ドラマ)
  • Mother-Son Movies from the 1970s(1970年代の母と息子の映画)
  • Critically-Acclaimed Crime Movies from the 1940s(批評家の高い評価を得た1940年代の犯罪映画)

この、すべての映画とドラマに人間によるタギングを施して、マシンのアルゴリズムによる(ということは相互に排他的である=1つもダブりがないということでしょう)分類を行い、7万数千ものジャンルを作った作業は、詳しく報じている記事によれば「ハリウッドをリバース・エンジニアリングする」ようなプロジェクトだったとのことです。

すなわち、映画・ドラマコンテンツというきわめて捉え所のない対象を、コンピュータによる分析が意味を成す程度の粒度にまで細かくかみ砕く作業を行ったということです。これにより、同社のすべてのストリーミングコンテンツは、ビッグデータ分析の結果が即座に適用できる「アイテム」となりました。重要なのは、サンプリングした一部のコンテンツにこれを行ったのではなく、「全部」に対してやったということです。人手による、気の遠くなるような手間暇をかけて、定性的な中身を持った商品に機械的な分析をかけられるようにした。このことが、同社の圧倒的な競走優位につながっていると思います。

これにより、数万〜数十万と見られる個々のクラスターがよく見るジャンルを細かく把握することが可能になり、レコメンデーションが精度を増したという流れになります。Netflixでは、誰がどういう映画・ドラマを見るか、よくわかるようになったのです。その結果、同社の視聴行動の75%はレコメンデーションが生み出しているということになりました。

これが経営の第1の課題である顧客のつなぎとめに奏功しています。しかし、時価総額を5倍に増やすには、まだ、これだけでは足りません。圧倒的に新規会員を増やすことができる何らかの方策が必要です。


■経営上の第2の課題:新しい顧客をどう増やすか?

同社では毎年のコンテンツ調達に20億ドルを投じています。売上46億ドルですから、かなりな割合です。本業を成立させるための欠くべからざる出費です。映画・ドラマコンテンツの買付費用は、基本料金と視聴件数別の従量制料金が組み合わさっている模様です。利益率を上げるには費用対効果を真剣に考えなければなりません。おそらくは、ここでも、新作・旧作の買付の最適解を求めるためのデータ分析が日夜行われていることでしょう。

ここで、ある時、同社の経営陣は、映画の新作・旧作だけに年間20億ドルを投じるよりも、一部は、オリジナルのドラマシリーズ制作に投じた方がよいのではないか、ということに気づきます。オリジナルのドラマシリーズ、1シーズン13エピソードが仮にヒットすれば、そして、それが同社独占配信ということになれば、新規会員獲得に大きなはずみが付きます。また、顧客つなぎ止めに効果の高い総視聴時間の増大にもつながります。

ということで、Netflixでは、2011年頃から、オリジナルのドラマシリーズ制作に取り組むようになります。2013年2月には数作目として、ケビン・スペイシー主演、デビッド・フィンチャー監督(「ソーシャル・ネットワーク」の監督)、政界物のオリジナルドラマ「House of Cards」13エピソードを一挙に公開し、これが大当たりしました。この時期に60万名以上の新規会員を獲得しています。

Houseofcardscommentary_2

House of Cardsの作り方は、ハリウッドのドラマ作りを根本から変えるとまで言われており、大変に革新的なものです。同社はこの制作に2シーズン(13エピソード×2)分として100億円以上を投資しました。
一般的に、米国のドラマシリーズでは、制作サイドからTVネットワーク会社に企画が持ち込まれ、反応がよいようだとパイロット第一作が制作され、それを見て13エピソード単位の投資が決定されます。しかしNetflixは大胆にもパイロット版を見る前から、企画内容と多少の脚本だけで、100億円以上の投資を決めました。それができたのは、同社が「この内容は必ずヒットする」ということがわかっていたからだと言われています。すなわち、上記の人手をかけたマイクロジャンル化により、あるクラスターに所属する会員たちは、ケビン・スペイシー主演作で、デビッド・フィンチャー監督作品で、政界物ドラマを確実に好む、というデータがあったからです。

House of Cardsの作り方は方々で話題になっていて、ネットコンテンツ界のバズの様相を呈しています。そしてこれに輪を掛けたのが、その次のオリジナルドラマ”Orange is the New Black”。この作品が画期的だったのは、House of Cardsが同名のイギリスで制作されたミニドラマとして存在して、ある程度はヒットした作品のリメイクだったのに対し、”Orange is the New Black”はまったくの新作。かつ、無名の女優たちによる物語だったにもかかわらず、13エピソード一挙公開後の視聴時間数が前作、前々作を大幅に上回る大ヒットになったからです。

これは結局、”Orange is the New Black”が分類されているマイクロジャンルが、同社顧客の複数のクラスターに好まれるという確信的なデータが存在していて、それに基づいて制作したという経緯があったのだと思われます。

Orangeisblackheader

既存のTVネットワークでは、大型のドラマシリーズをヒットさせるためには、同じ時間にぶつけられて放映される作品と「視聴率」を奪い合わなければなりません。高い視聴率を得るにはある程度の広告を打たなければならず、これにも相応のコストがかかります。それに対して、Netflixでは、オンラインストリーミングという特別な配信環境を持っているため、他のTV局と視聴率競争をしなくてもよいという、恵まれたポジションにいます。新作をヒットさせるために有料広告を打つ必要もありません。(もっとも、予告編を様々なクラスターに訴求するために複数種類作って、Youtubeに上げるということはやっています) それは、同社はその作品が配信される前に、自分たちが想定した規模でヒットするということをわかっているからです。

同社のプロダクトイノベーション担当ヴァイス・プレジデントTodd Yellinは、「有料配信サービスとは美しいものだ」と言っています。これは、既存のTV局と競走をしなくてもよいということも含まれていますが、顧客の視聴の一挙手一投足がデータとして取れ、何を好むかがわかり、それにあてがえるコンテンツを正確に配信できるという自信の表れでしょう。また、彼はTVの成果指標である視聴率の時代は終わった。現在は、個別の顧客が何を好むかわかった上でそれに当てられる作品が配信できたかどうかが問われる時代だ、という意味のことを言っています。

1日数テラバイト、年間数ペタバイトの視聴行動データ、それからわかる顧客クラスターと好みのマイクロジャンル。それによって可能になる精度の高いレコメンデーション。そして、新作ですら作る前からある程度のヒットが予測できる。これはもはやビッグデータがもたらす映画・ドラマの未来と言っても過言ではありません。

ビッグデータ分析のテクノロジーについては次の投稿で補足します。

Comment(0)