ブログへの書き込みからユーザ属性を高精度で推定する技術が実用化間近
»
毎年恒例の年度末の多忙さからようやくと開放され、通常運転に戻ってきた。その間に溜めていた「あとで読む」タグをつけた記事を振り返っていたら、富士通総研の安藤さんの面白い記事をみつけた。
「ソーシャルメディアから把握する生活者の実態」という記事なのだが、ソーシャルメディア分析における最新の技術として「ユーザ属性の推定」と「有用データの発見」方法を紹介している。
これまでほとんどのブログは、プロフィールが公開されていないため書いたユーザーがどのような人なのかわからなく属性把握が困難だと言われていたが、ブログの過去記事を専用の学習システムに読み込ませて分析することで、それを可能にしたとある。その推定精度については
現在のところ、性別・配偶者の有無については8割の精度、職業(中高生・大学専門学校生、社会人、主婦(兼業を含む)、シニア)については6~7割の精度が出ており、この他に子どもの有無、ペットの有無、在住地域(東京・大阪・愛知・その他)、趣味(50分類)などが推定できるようになっています。
とかなりの精度ものだ。
もうひとつのソーシャルメディア上の膨大なビッグデータからの有用データの発見についても、言語学でモダリティ(発信している内容に対する発信者の判断や感じ方を表す言語表現)に着目することで可能になるという。
2011年からソーシャルメディアに関する研究に着手し、ようやくその有効活用手段を提供できる道筋が見えてきました。課題を克服し、近い将来にはサービスとして提供したいと考えています。
安藤さんも記事の最後でこう書かれているが、これらのサービスが実用化されると、今は試行錯誤と手作業で行っているソーシャルメディア分析における最初の段階の仮説立案作業が一変する可能性がある。
しばらく、業務に追われて最新の技術やサービスを見ていなかった私だけど、この2つの技術を見てちょっとワクワクしてきている。
SpecialPR