【最新】 トンデモ・データ? Twitter国別・都市別シェアの真偽
世界中から毎日のように発信されているソーシャル系,モバイル系のトラフィックデータに触れていると,信憑性の高いものから,ん?と思うものまで,実にさまざまだ。
メディア記者や我々ブロガーからすると,このデータの信憑性をいかに読み解き,できるだけ正確と思われる情報のみ抽出するかが読者から信頼いただくために重要なわけだが,これがなかなか一筋縄ではいかないところがある。
その点では,この分野の先駆者であり,ネット上のデータ信憑性に深い見識を持たれている衣袋 宏美氏のブログは大変に勉強になるのでご紹介しておきたい。
・ Insight for WebAnalytics
・ 調査データを斬る
そして,自戒の意味もこめて,こんな例があるという最新情報を紹介しておきたい。カナダのSocialmedia調査会社のSysomos社から2010年1月14日に発表されたばかりのTwitterユーザーの国別分布に関する調査データだ。
・ Exploring the Use of Twitter Around the World (2010/1/14)
・ The Top Twitter Countries and Cities (Part 2) (2010/1/22)
国内外を問わず多くのメディアが報じたので,Twitterトラフィックに興味のある方であれば,次のようなチャートを最近目にされたのではないだろうか?
このデータは,Sysomos社が,2009年10月16日~12月16日の間に投稿されたツイート1300万件を元にTwitterアカウントを分析したもので,国別ないし都市別情報は「ユーザーが開示しているデータから同社独自の技術で抽出したもの」とある。ちなみにTweetに位置情報を付加しているユーザーの割合は0.23%とのことで,今回の統計では参考にされていないようだ。
この表を見て違和感を感じる点がいくつかあるが,特に我々にとって重要なのは日本のシェアが過小評価されている(国別で日本は1.22%で10位)のではないかという疑問だ。
例えば最新GoogleTrends(デイリーユニークユーザー)によると,国別分析では日本は第3位だ。
また,Twitterがブレイクする前する前のデータなので単純に比較することはできないが,2008年2月にTwitter社自身が ブログ で発表したという大変貴重なWebトラフィックの国別シェアがあるのが,ここでは日本は米国についで2位,約23%と紹介されている。(このブログにあるように,このデータにもAPI経由,携帯経由の情報は含まれていない)
【参考記事】
・ Twitterが国別のトラフィックを公開--米国が4割を占め1位、日本は2位に (CNET, 2009/2/21)
さらに2009年後半の日本国内のブレイクを考えると,Sysomos社発表の1.2%というのは明らかに違和感がある数字なのだ。
そして,この原因は,Sysomos社の分析がユーザー設定の「現在地(Location)」をベースにしている点にあると思われる。
例えば私は自分の現在地を「Tokyo, Japan」と書いているが,これは完全にフリーフォーマットなため,ユーザー個々が工夫して,実に多様な書き方をしている。今,私のタイムラインに出た方々の現在地をリストアップしてみると次のような感じだ。
- Tokyo
- 東京
- Tokyo, JP
- つくば
- 東京都港区(外延前)
- Azumino City, Nagano, Japan
- Chiba
- 横浜
- アラウンド東京多摩川
- 現実と幻想の狭間 <--- 面白いです
この10件の中から,英語系中心に分析するソフトで日本と識別できるのはToykoないしJapanが入っている3件だろう。実際にSysomos社データでは,英語圏のシェアが相対的に高めにランクされているようだ。
ほぼ同タイミングに発表されたHubSpot社の Twitter調査資料 の中にも,同様にユーザープロフィールの統計として次の表がレポートされていた。(600万Tweetを元に分析した結果)
これがロケーション情報の素の分析結果だ。トップがロンドンをはじめ,先ほどのSysomos社データに類似している点が多いのが一目でわかる。
【参考記事】
このHubSpot社発表資料に基づく調査報告。ただしこのロケーションは眉唾だったので掲載していない。
・ 【速報】 2010年1月 最新Twitterユーザー調査 (筆者記事,2010/1/20)
あくまで私見だが,Sysomos社は,この基礎データに対して国都市対応表を当てはめるような形で換算しており,英語を中心に,ポルトガル語,スペイン語など限られた言語しか分析対象としていないように類推される。
そして今回はSysomos社データを取り上げたが,前述の衣袋氏がブログでご指摘されている通り,深く調査すればするほど「ネット上の怪しげなデータ」が見えてくるようになり,それが思ったより普通に流通している事実がわかってくる。最近多くの方から筆者のブログやTwitterをビジネスの参考にされているという励ましの声をいただくと,なおさら情報信憑性にアンテナを張る必要性を切に感じており, 「この怪しげなトラフィック統計め!」 とイラっとしてしまいがちだ,というお話でした。
【追記】
当初 「このブロガー泣かせの怪しげなトラフィック統計め!」と刺激的なタイトルをつけていましたが,本当に怒っていると心配いただいた方がいらっしゃったので,穏やかめにタイトルに変更してみました。
【関連記事】
・ 【速報】 Twitterトラフィックに関するGoogleTrendsデータが大幅修正された件 (2010/1/18)
・ツイッターは本当にスローダウンしているのか?現在のアクセス状況に関する多面的な考察 (2009/11/25)
【自薦シリーズ記事 ご紹介】
ザッポスの奇跡 米国ザッポス「顧客にWOW!をお届けする」奇跡の経営,その本質を探る (12/05)
企業ツイッター 企業Twitter開局大作戦 ~ 「第一話 Androidタブレットを販売せよ!」 (01/09)
【in the looop 2009年 アクセス・トップ7記事 ご紹介】
1位 Google Phone"Nexus One" ネット上のバズを総まとめ (12/13)
2位 mixi,モバゲー,iPhone 徹底比較 「どのアプリが一番儲かるか?」 (12/01)
3位 個人が印税35%の電子書籍を出版できる時代 - Amazon Kindleの衝撃 (12/30)
4位 【速報】昨日からネットで大騒ぎ "PhotoSketch"が凄い件 (10/07)
5位 【2009年11月最新版】直近決算発表に基づくmixi,モバゲー,GREEの業績比較 (11/12)
6位 【速報】Twitterデイリー訪問者数で,ついに日本が米国に並んだ! (12/20)
7位 Googleは20%ルールによってイノベーションのジレンマを回避している (12/21)
斉藤Twitter。ご連絡などお気軽にどうぞ。 http://twitter.com/toru_saito
ループス社Twitterアカウントはこちらです。 http://twitter.com/LooopsCom
最新の筆者著書です。 『Twitterマーケティング 消費者との絆が深まるつぶやきのルール』