人間は無関係なものに関係を見出す
それを重要なように見せるのも容易

 そんなわけで、星座と死亡する日にはつながりがあるようだが(というより実際にある)、それらを結びつけているのは「誕生日」という第3の要因だ。それは「交絡因子」や「潜伏変数」と呼ばれている。

 世間での星占いの人気を見ると、実際には無関係なもの同士のあいだにつながりをつくりだすことに、人がいかに長けているかがわかる。タイタニック号が沈没した原因は「水星の逆行」あるいは「稀な惑星直列」だったのだろうか。

 その可能性はほぼないだろう(注:タイタニック号が沈没する原因となった氷山は、過去数世紀で地球から最も近い位置にあった月が起こした通常よりも高い大潮によってできた可能性がある、という科学的な説もある)。それでも、「起きていることには理由、理屈、パターンがある」と信じることによって、人は安心できるのだ(そう信じることが、精神衛生上必要なときさえもある)。

 こうしたことから浮かび上がる問題点は、2つの物事の関連性が単なる偶然にもかかわらず、あたかも重要なものであるかのように見せるのは簡単だということだ。たとえば、「チーズを食べる量」と「シーツで死亡する」例のように。

書影『ヤバい統計 政府、政治家、世論はなぜ数字に騙されるのか』『ヤバい統計 政府、政治家、世論はなぜ数字に騙されるのか』(集英社)
ジョージナ・スタージ 著、尼丁千津子 訳

 大きなデータセットを十分に長いあいだ掘り返せば、統計的に有意な結果を「採掘」できることは、すでに示されている。これは、星座についてもまさに行われてきたことだ。

 研究者たちは1000万人分の巨大な医療データセットを分析して、高度なモデルを構築し、すべての正しい手順を踏んだ結果、「獅子(しし)座の人は消化管出血を起こす可能性が高い(P=0.0447)」「射手(いて)座の人は上腕骨骨折を負う可能性が高い(P=0.0123)」と結論づけた。

 この2つの「P」の値は、それらの結果が統計的に有意であることを示している。この事例の結果については、常識的に考えれば却下できる。一方、もっともらしい説明をされて、結果をつい額面どおりに受け取ってしまいたくなるような事例もある。