エンタープライズコラボレーションの今と今後を鋭く分析

画像や動画のタグ検索の際には、紹介文に含まれてない語のタグに注目

»

タグ・タギングに関する話の続き。

 この分野に関する研究が少ないと嘆きつつ、それでもいろいろと考えたり捜したりしているうちに高梨健氏の「P2Pネットワークにおける関連情報の動的抽出 」という修士論文にたどり着いた。{詳細はココにあるようです。予稿論文発表資料
 この論文の中にちょっと面白い実験結果がある。被験者にある画像を見せてタグ付けを行わせる実験の結果だ。

 この実験では画像へのタグつけにあたって途中で2種類のテキストを被験者に読ませているが、タグのおおよそ7割か8割はこの被験者に読ませたテキストのタイトルか本文に含まれるとのことだ。同じくこの時の複数の被験者間でのタグの重複度合いはおおよそ60%とある。この論文では、この付与されたタグの本文及びタイトルへの含有率を全文検索でのカバー率、タグの重複率をフォークソノミー型検索でのカバー率と見ているようだ。

 テキストによる説明文とタグがこれだけ合致してしまうとなると、画像検索や動画検索の際のタグ検索って紹介文の全文検索と比較して優位性がほとんどないということになる。例外は検索結果がより沢山出てき過ぎる場合に、絞り込むようなケースか・・・。

 しかし前にも書いたように個人的な感覚的にはニコニコ動画などでのタグ検索は「使える」のだ。なぜだろう・・・
 この論文では実験結果として、本文及びタイトルへ含まれなかったのにもかかわらず付与されたタグの被験者間での重複率も提示(8%~17%)しておりこれらを「低い確率ではあるが重複した(中略)貴重なタグ」としている。ここにヒントがありそうだ。ああいった場で他人の為に付与されるタグのいくつかは「感想」だの「評価」だのように紹介文に含まれない語になっており、それらが効果を発揮しているのかもしれない。

 これを確かめるとするならば、例えば画像(動画)へのタグの付与時に、既に紹介文等に含まれている語はタギング出来ない(あるいはそういう語は数を限定)ような仕様にしてしまって、紹介文の全文検索機能とタグ検索機能で比較してみることになる。

と思っていたら、既に1年半も前にはてブで同じようなことを「テーマタグ」として書かれている方がいらっしゃった。ずいぶん前の提言ですがこれがその結果どうなったかちょっと興味がわくところだ。

Comment(2)

コメント

通りすがり

> 低い確率ではあるが重複した(中略)貴重なタグ

「孔明の罠は本文には含まれない」という事を考えたら、感覚的には難しい話ではない気がします。
後は、感覚に理論が追いついてくれるだけかと。

そうですね。「才能の無駄遣い(使い)」「愛すべき馬鹿」「○○に定評のある作者」などは本文には含まれませんね。あと「○○ホイホイ」系もそうかな・・
 確かにこれらは重要なタグだwwwうーん、こうなるとやはりニコ動の登録者以外によるタグでは紹介文本文に入っている単語はタグに入れられないようにすると面白いかも。

コメントを投稿する