データのトリックにだまされるな
我々は、インターネットの普及により、
さまざまなデータを容易に手にすることが出来るようになった。
必要であれば、欲しいデータ名を検索すれば、
政府や行政庁、各種研究所や大学、マスメディアや各種団体などが発表した統計に
苦もなくたどり着くことが出来るだろう。
しかし、そのデータの正確性は別として、
データはその表現方法により、恣意的に印象を操作出来るので、
よく注意しなければならないだろう。
さて、それにはどのような手法があるか、例を挙げて紹介したいと思う。
◆ケース1 10年間の変動数値のデータ
今ここに次のような10年間の変動数値があったとしよう。
年数 値
1 100
2 105
3 110
4 120
5 115
6 110
7 110
8 120
9 125
10 120
これをグラフにすると次のようになる。
この数値は、10年間にわたり緩やかに増加していることが判る。
しかし、次の図のように、縦軸の幅を広くして、少ない数値部分をカットすると、
まるで急上昇しているように見える。
ここに、上昇ラインでも入れようものなら、さらに上昇傾向が強調される。
◆ケース2 支持率の調査
続いて、ある支持率調査について考えてみよう。
今、次ぎようのような調査結果があったとする。
支持する35%
支持しない30%
どちらでもない35%
このデータを見る限り、支持する人がやや多いものの、
かなり意見は拮抗しているように見える。
しかし、次のようにグラフを作成すると、
「支持する」と「支持していない」のデータが、かなり離れているように見える。
◆ケース3 言葉の表現によるトリック
最後に、次のようなデータを考えてみよう。
行きたい人40%
行きたくない人30%
考え中の人30%
この結果を言葉で表現すると、次のようなものが考えられる。
・ほぼ半数近くが行きたいと考えている
・検討中を含め70%の人が行きたいと考えている
・60%の人が行きたいとは考えていない
・半分以上の人が行きたいと考えていない
などである。
どれもが特に間違ってはいないが、その印象はまったく異なってしまうのだ。
さて、このような子供だまし的な操作が行われているワケがないと
考える読者がいるかもしれないが、
案外注意して見ていると、そのデータの出所に関わらず、
ちょくちょく見かけることが少なくないように思う。
したがって、
データの表現方法のトリックには、だまされないよう注意したいものだ。
「データのトリックにだまされるな2」に続く
http://blogs.itmedia.co.jp/hiramoto/2012/05/post_28.html