オルタナティブ・ブログ > 一般システムエンジニアの刻苦勉励 >

身の周りのおもしろおかしい事を探す日々。ITを中心に。

twitterのハッシュタグを自動表示するパーツの懸念点

»

ツイッター公式の指定ハッシュタグ表示パーツを用いるとブログに特定ハッシュタグを流すといったことができて盛り上がるのですが、特定の発言をフィルタリングすることができません。例えば過去には2つのイベントで同じハッシュタグを使ってしまう「衝突」ということがありましたが、そのような場合にも意図的な交通整理はできず、指定したハッシュタグがどんどん流れる形になってしまいます。また、何らかの意図でハッシュタグを広めはじめたのに意図に反する発言があった場合にも削除ができないということは大きな問題であるように思います。(twitter社へのスパム報告は可能なのでしょうが。)

一般例として、ある人がハッシュタグを使おうとしていて、それに対して意図的に汚染しようとする人がいた場合、公式のtwitterパーツでの防御は非常に難しいと思われます。(ハッシュタグは長さやユニークさなどが十分に工夫され、一般的な単語を不当に占有するようなケースではないことを前提とします。)では一度WEBサーバに貯めて、そのあとにNGワード設定をかけることで元通りの楽しいとりったーにすることはできるのでしょうか?これはいたちごっこになってしまい、おそらく効力がないと思われます。

一例を挙げますとYahoo!ジャパンにはtwitterのリアルタイム検索機能があります。そのページを開くと20ほどのホットトピックスというか、いま話題になっているキーワードが表示されます。このキーワードを前後にくっつけて、アフィリエイトや詐欺等のサイトに無理やり誘導してしまおうということを試みている勢力がいます。これに対しては以前ほどの見苦しさがなくなってきていることから、Yahoo!ジャパン側が何らかの対策を行なっているように思います。Yahoo!ジャパンの取り組みが何なのかはわかりませんが、何らかの技術的な対策方法がきっとあるのでしょう。

自力での取り組みをするならばどのような運用が考えられるでしょうか?上に挙げたようなNGワード方式は非常に難しいということが考えられます。とすると、アカウントに対して何らかの制限をかけるということが考えられます。残念ながら公式のtwitterパーツではアカウントのOK,NG判定をしてから発言を流すということができないため、何らかのサーバに一度蓄積するということがどうしても必要となり、サーバ等の投資が必要になってしまいますが、ひとまずその方向しかアイデアが出なかったので以下に別の3案を考えてみました。

その1です。診断メーカーというサイトがあります。診断メーカーはあくまで代表として挙げたまでですが、類似のサービスの多くはtwitterのAPIを用いて自身のアカウントの過去の発言を取得し、それをバラバラにして単語の出現頻度等を分析して占いや診断といったアルゴリズムに通しているようです。これによってハッシュタグと関連深い発言をする人をさがしてくることができると思います。キーワードの分析期間を過去1ヶ月等に設定すれば、そこまでの努力をしてまでハッシュタグを邪魔する人は激減すると思われますし、それを突破した人は別途手動で作成するブラックリストで対処できる数に絞られると思われます。

その2です。これはいっそのことtwitterアカウントの認証を通じて受験する「テスト」を開催し、合格した人がつぶやいたハッシュタグ付tweetだけを表示するというものです。

その3です。ある一定期間の過去の発言を収集し、信頼出来る人のリストを作成します。その人々からのフォロー数が5人とか10人を上回る人は信頼出来る人とみなしてハッシュタグ連携させるというものです。SNSらしいですね。

2012/8/31 2:10 追記 ハッシュタグと連携するtwitter公式ブログパーツ全般で通用する内容に書き直しました。

Comment(0)