画像や動画のタグ検索の際には、紹介文に含まれてない語のタグに注目
タグ・タギングに関する話の続き。
この分野に関する研究が少ないと嘆きつつ、それでもいろいろと考えたり捜したりしているうちに高梨健氏の「P2Pネットワークにおける関連情報の動的抽出 」という修士論文にたどり着いた。{詳細はココにあるようです。予稿、論文、発表資料}
この論文の中にちょっと面白い実験結果がある。被験者にある画像を見せてタグ付けを行わせる実験の結果だ。
この実験では画像へのタグつけにあたって途中で2種類のテキストを被験者に読ませているが、タグのおおよそ7割か8割はこの被験者に読ませたテキストのタイトルか本文に含まれるとのことだ。同じくこの時の複数の被験者間でのタグの重複度合いはおおよそ60%とある。この論文では、この付与されたタグの本文及びタイトルへの含有率を全文検索でのカバー率、タグの重複率をフォークソノミー型検索でのカバー率と見ているようだ。
テキストによる説明文とタグがこれだけ合致してしまうとなると、画像検索や動画検索の際のタグ検索って紹介文の全文検索と比較して優位性がほとんどないということになる。例外は検索結果がより沢山出てき過ぎる場合に、絞り込むようなケースか・・・。
しかし前にも書いたように個人的な感覚的にはニコニコ動画などでのタグ検索は「使える」のだ。なぜだろう・・・
この論文では実験結果として、本文及びタイトルへ含まれなかったのにもかかわらず付与されたタグの被験者間での重複率も提示(8%~17%)しておりこれらを「低い確率ではあるが重複した(中略)貴重なタグ」としている。ここにヒントがありそうだ。ああいった場で他人の為に付与されるタグのいくつかは「感想」だの「評価」だのように紹介文に含まれない語になっており、それらが効果を発揮しているのかもしれない。
これを確かめるとするならば、例えば画像(動画)へのタグの付与時に、既に紹介文等に含まれている語はタギング出来ない(あるいはそういう語は数を限定)ような仕様にしてしまって、紹介文の全文検索機能とタグ検索機能で比較してみることになる。
と思っていたら、既に1年半も前にはてブで同じようなことを「テーマタグ」として書かれている方がいらっしゃった。ずいぶん前の提言ですがこれがその結果どうなったかちょっと興味がわくところだ。