「すべての科学研究は真実である」と考えるのは、あまりに無邪気だ――。
科学の「再現性の危機」をご存じだろうか。心理学、医学、経済学など幅広いジャンルで、過去の研究の再現に失敗する事例が多数報告されているのだ。
鉄壁の事実を報告したはずの「科学」が、一体なぜミスを犯すのか?
そんな科学の不正・怠慢・バイアス・誇張が生じるしくみを多数の実例とともに解説しているのが、話題の新刊『Science Fictions あなたが知らない科学の真実』だ。
単なる科学批判ではなく、「科学の原則に沿って軌道修正する」ことを提唱する本書。
今回は、本書のメインテーマである「再現性の危機」の実態に関する本書の記述の一部を、抜粋・編集して紹介する。

【統計学「p値」の謎】統計学好きでも意外と説明できない「p値」の正体Photo: Adobe Stock

「数字にはノイズがある」

「数字にはノイズがある」という考え方を紹介したい。

あらゆる測定値とあらゆるサンプルは、ある程度のランダムな統計的変動、測定誤差、サンプリング誤差を伴う。これは人間が偽のノイズをつくることが難しいというだけでなく、ノイズと科学者が探しているシグナルとを見分けることも難しい。数字のノイズはランダムな外れ値や例外を生むため、実際には意味のないパターンや誤解を招くようなパターンが現れる。

たとえば、新薬を服用したグループとプラセボ(偽薬)を服用した対照グループとのあいだで、痛みの報告に明らかな差があったとしても、完全な偶然によるものかもしれない。2つの測定値のあいだに相関関係があるように見えても、データセット内で起きた偶然にすぎず、再現実験をおこなっても二度と現れないかもしれない。粒子加速器でエネルギーのシグナルが見えたと思っても、ランダムな揺らぎによるものだと判明するかもしれない。

自分が興味を持っている効果と、偶然やエラーの気まぐれをどのように見分けることができるか。大多数の科学者にとって、その答えは「p値を計算する」である。