グーグルのクラウドを支えるテクノロジー > 第50回 大規模レコメンデーションシステムのアーキテクチャー(パート3)
私が編集支援している中井悦司氏のグーグルのクラウドを支えるテクノロジー第50回「大規模レコメンデーションシステムのアーキテクチャー(パート3)」がCTC教育サービスで公開されました。
興味がある方はご覧ください。
###
はじめに
前回に引き続き、2016年に公開された論文「Deep Neural Networks for YouTube Recommendations」をもとにして、ビデオストリーミングサービス(YouTube)のレコメンデーションシステムを支える機械学習のアーキテクチャーを紹介します。「候補選択モデル」と「ランキングモデル」の組み合わせからなるこのシステムについて、今回は「ランキングモデル」の仕組みを解説します。
2つのモデルの役割
ランキングモデルの解説に入る前に、2つのモデルの役割を復習しておきましょう。第48回で説明したように、すべてのビデオコンテンツという膨大なデータに対して、高速、かつ、正確にレコメンド対象を選択するというのは簡単なことではありません。このシステムでは、ユーザーが直近に視聴した一定数の動画、そして、同じく一定数の直近の検索キーワードという限定的な情報をもとにして、まずは、数百のレコメンド候補を選択します。これが「候補選択モデル」の役割です。
今回説明する「ランキングモデル」では、その後、より多くの種類の情報を用いて、最終的なレコメンド対象動画を決定します。ここでは、動画を視聴するプラットフォーム(動画を閲覧するアプリやホームページの種類)に固有の情報も利用することが論文の中で触れられています。たとえば、動画の内容がユーザーの好みにあっていたとしても、該当プラットフォームで表示されるサムネイルの選択によって、それをクリックする確率が下がるような場合も考えられます。このように、動画の内容だけではなく、動画とユーザーを紐付けるさまざまな情報を用いることで、それぞれのユーザーが「実際に視聴する動画」をより高い精度で予測しようというわけです。
この続きは以下をご覧ください
https://www.school.ctc-g.co.jp/columns/nakai2/nakai250.html