統計学の威力を適切に利用したいなら、やってはいけない注意事項がいくつもありますが、そのなかでもとりわけ大切なのは「サンプルデータの偏りを避ける」ことです。インターネット調査は、この点で致命的な欠点をもちます。

 インターネット調査であることの偏りを補正したはずなのに、図表4をみると、高齢者については補正ができていなかったことが明らかでした。優れた統計手法を駆使しても、十分な補正ができないほどの強い偏りがあったからでしょう。

 総務省の2つの調査ーーー人口とインターネット利用率の調査に基づいて、私が「インターネット調査は人口のどれくらいの割合をカバーできるか」を、男女別・年齢別に計算して整理したものが、図表6です。おおまかに区切ると、60歳未満の成人(20〜50歳代)人口の93%は、インターネット調査によってカバーできます。

 しかし、60歳以上の人口でみると、インターネット調査がカバーできるのは49%だけです。70歳以上の女性となると、カバー率は30%を切ります。対象者の約7割の人たちからサンプルを抽出できないことは、大きな問題です。

 わかりやすくいえば、「インターネット調査のうち、60歳以上の高齢者についてのデータは参考にすべきでないーーー参考にすると、まちがった結論が出る危険性が高い」と、肝に銘じておくべきです。冒頭で題材にした雑誌は、おそらくこの欠点をよくわかっているために、65歳以上の人たちに対する調査をあきらめ、さらに、グラフを示すときに60〜64歳のデータだけを省略したりしたのでしょう。

 また、日本交通公社の分析は、インターネット調査の問題点をはっきりと意識したうえで、しかし、統計学的な手法での補正を過信したために、大失敗していました。これらの事例では、「膨大な量のデータ=ビッグデータ」が集められるインターネット調査と、ある程度の問題点なら補正できる「統計学」の威力を過信したことで、日常的にデータの分析をおこなっているはずの人たちが、いとも簡単に、データ分析に失敗しています。

 日本での「ビッグデータ&統計学ブーム」の危険性が、これらの事例に集約されていると、私は考えます。しかも、若者もふくめて人口が増えているアメリカと異なり、日本では、人口減少と少子高齢化が進行し始めていて、さらに加速する見込みです。日本では、たいていのビジネスにおいて、高齢者は相対的に“上顧客”のはずです。

 図表6で示した問題があるために、インターネット調査は、日本ではビジネスの参考にならない。そう考えるほうが無難です。インターネット調査を参考にすると、裕福な高齢者を軽んじて、貧乏でネット上での無料に慣れた若者に重点を置く、愚かなマーケティング戦略や価格戦略を選びやすくなるでしょう

※次回公開は9/18です


<10月3日発売予定!>

データ分析ってこうやるんだ!実況講義
身近な統計学の読み方・使い方

吉本佳生・著 ダイヤモンド社・刊

ビッグデータ時代の使える!データ分析入門

統計学がわからなくても大丈夫!文系ビジネスパーソンがビジネスで使えるデータの整理・分析プロセスを全公開!

統計学がわからなくても大丈夫!安価に大量のデータにアクセスできるビッグデータ時代を味方につけ、文系ビジネスパーソンがビジネスで使えるデータの整理・分析プロセスを全公開。身近な事例を使ってビジネスヒントを掘り起こす手法を伝授します!

ご予約はこちらから!Amazon