統計の偏り


統計

内閣支持率や人気商品ランキングなど、日本人は統計が大好きな国民です。アメリカ人も比較的好きな人が多いようですが、世界の多くの人々はこうした数字をほとんど信用していません。たとえばミシュランの星などをありがたがるのは日本の特徴のようで、これは今に始まったことでなく、江戸時代から店の番付などのランキングがありましたから、日本文化の1つといえそうです。

統計結果の発表で%がよく使われますが、%記号は/100を変形したもので、英語ではper centつまり「百で割ると」という意味です。時速などに/secと表記したり、面積当たりの単価を¥/㎡と表記するのと同じ原理です。パーセントは日本語で百分率といい、この方が直感的にわかりやすいと思うのですが、外来語好きな人はパーセントを用います。そのため政治家などが「1万パーセントない」などという比喩表現の奇妙さに気づきません。もし「1万百分率」といえばおかしさにすぐ気が付きます。

百分率というように、多数を直観的にわかりやすくするために換算したものなので、百以下の集計なら実数が正しく事実を表現できます。もし二人しかいないならば、50%か100%しかありえません。少し数を増やしてみても結果は同じで%表示の意味がないのです。一番奇妙なのは「100%はすべて」なので、それ以上の数字が理論上はありえません。100%以上は表現上のアヤ、強調的比喩なので、こういう表現をする人は「なにかをごまかそうとしている」と思われてもしかたがないのです。

よく使われる「売り上げが前年度比200%」という表現も、本来は前年度の2倍で済むところです。120%ではなく1.2倍で何の問題もないので、少数をわざわざ百分率にするのは何か隠れた意図があります。大きくみせたい時が多いようです。

内閣支持率などの調査の場合、すべての人を調査対象にはできないので、一部の人を調査対象として、統計的処理技法によって「推定」します。統計処理技法にはいろいろあり、有意水準とか危険率なども考慮しないと結果の信頼度が保証できないのですが、マスコミなどではほぼ発表されません。単純に百分率を示すだけです。そうなると調査対象が問題です。与党支持者だけを対象にするのと野党支持者だけを対象にする場合では結果が違うことが当然予想されます。よく電話アンケートなどで「無作為抽出」といいますが、電話という媒体を使う段階で無作為ではないのです。街頭インタビューでもどこの街頭かで結果は違うでしょう。全国といっても都会と地方では異なるはずです。実際に調査する場合、こうした偏りをどう是正するか、かなり悩みます。科学的実験においては完全にランダムにすることは不可能ですが、社会調査の場合、意外に杜撰な調査で結論を出すことが多いのが実情です。

2024年10月
 123456
78910111213
14151617181920
21222324252627
28293031  

コメントを残す