そこで、もっと旅行ビジネスのデータについて真剣に分析している資料を探して、たまたまみつけたのが、公益財団法人日本交通公社の観光文化事業部が発行している『旅行者動向2012 国内旅行マーケットの実態と旅行者の志向』(2012年)でした。詳細なデータを掲載していて、さすがに70歳以上のデータも調べています。
拡大画像表示
ところが、その日本交通公社のデータも、“ビッグデータ&統計学ブーム”の落とし穴にハマってしまった典型例でした。いちばんわかりやすいのは、図表4で引用したデータでしょう。
旅行の計画を立てるときの情報収集源について、複数回答可で調査した結果を、2008年調査と2011年調査で比較していました。表で整理してありましたが、そのうちの「ネットの検索サイト」の回答率だけを、男女別・年齢別でグラフ化したのが図表4です。
「女性20代」でだけ、回答率が下がっていますが、他のすべての人たちでは、ネットの検索サイトと回答した割合が高まっています。ただし日本交通公社は、2008年と2011年とでは調査方法を変えています。2010年からインターネット調査に切り替えたのでした。
先ほどの雑誌とは異なり、日本交通公社はインターネット調査への切り替えがもつ影響を意識しているのですが、それでも、きわめて不適切なデータ読解をしていました。調査方法のちがいが影響をもたないかのように、図表4に整理した回答率の変化を素直に解釈し、その下につけた脚注で、つぎのような解説を加えています。
インターネット調査に切り替えたことによる影響(偏り)は、統計学的な手法できちんと補正していて、補正後の結果を示して分析している。だから、インターネット調査であることの影響を考えずにデータを読めばいい。これが、『旅行者動向2012』での日本交通公社の考え方です。
しかし、たとえば「女性70歳以上」が「ネットの検索サイト」を情報源と回答した割合は、2008年では9.1%だけだったのに、2011年には46.7%にまで上がっていて、異常な変化にみえます。……実際に、異常な数字であることは、総務省によるインターネット利用率の調査と比べると、はっきりわかります。