ビッグデータ時代の到来がさけばれ、データ読解・活用力がますます問われるようになりました。危機感を持つ文系ビジネスパーソンに対し「統計学などの専門知識がなくても、基本的なデータ読解力があれば、仕事にも十分応用できる!」と力強いエールを送るのは、数多くの著書で鮮やかなデータ解析力を披露するエコノミスト吉本佳生さんです。身近なデータを使いながら読解プロセスや読み誤りを防ぐコツをまとめた、吉本さんの新刊『データ分析ってこうやるんだ!実況講座』の10/3刊行を記念し、発売に先立って内容の一部を本オンライン連載にてご紹介します! 初回のテーマは、身の回りにあふれるインターネット調査の罠についてです。

 2013年の初めぐらいから本格的に話題になり始めた「ビッグデータ」と、そのビッグデータを分析するための「統計学」ブームに対して、データ(数字)の威力、そして統計学の威力が痛いほどわかっているからこそ、心配していたことがあります。私の危惧する落とし穴がよくわかる事例を2013年7月にみつけたので、ふたつほど紹介します。

 ひとつは、あるビジネス雑誌に掲載されたデータです。テレビについてのデータをたくさん掲載し、「会議で使えるビジネスデータ」という表題で有用性をアピールしていました。その雑誌の足を引っ張りたいわけではありませんから、実名は伏せますが、ざっと読んだうえで「これを会議に使ってはいけない。こんなデータをビジネスの参考にしたら、大失敗する危険性が高い!」と感じました。

 その理由がわかりやすいように、問題点だけを強調したのが図表1です。多くの人は、グラフをみるときに、中央の(データがグラフ化された)部分にまず目が行きがちですが、それだと問題点がわかりにくいので、グラフ部分はぼかしてあります。

 見て頂きたいのは左軸です。図中で指摘しているように、年齢別で分けたデータの最後が「60〜64歳」となっています。じつは「65歳以上の高齢者」を調査対象から除外したデータなのです。

正確には「日本全国の10~64歳の、パソコンからのインターネット利用者」を対象にした、大規模な調査に基づくデータ、ということです。こうした年齢制限や、ネット調査であることは、雑誌記事のなかでは説明されておらず、データにだまされやすい人は決して読むべきでない記事だといえます。