科学的エビデンスのある素晴らしい健康法が発見されたというニュースがメディアを騒がせ、そのうち話題にならなくなって、また新しい健康法がブームになる。だったら前の話はどうなったのかというと、多くの場合、再現性がないことがわかって忘れられてしまったのだ。

 紅茶キノコを飲んだらがんが消えたという論文がどこかの学術誌に掲載されたとしても、これだけで紅茶キノコの治療効果が証明されたわけではない。ほんとうに効果があるかを知るためには、他の研究者がより精緻な手法で実験結果を検証する必要がある。このテストに失敗すると、その結果はたんなる偶然で「再現に失敗した」とされる。

 最初は正しいと思ったのだが、よく調べてみると偶然=偽陽性だったという残念な事態は、健康法だけでなく、医学、栄養学、心理学、社会科学などで頻繁に起こっていて、物理学のようなハードサイエンスも例外ではない。

 2005年、メタサイエンティストのジョン・ヨアニディスは「なぜ発表された研究結果の大半が誤まりなのか」という論文を発表し、「科学論文に書かれているあらゆる主張は、真実であるより偽りである可能性のほうが高い」と主張した。

 2015年の検証では、心理学の権威ある学術誌3誌から100件の研究を選んで再現を試みたところ、最終的に再現に成功した研究はわずか39%だった。2018年には一流の学術誌『ネイチャー』と『サイエンス』に掲載された21本の社会科学論文の再現が試みられたが、成功したのは62%だった。

 イギリスの若手心理学者スチュアート・リッチーの『Science Fictions あなたが知らない科学の真実』(矢羽野薫訳/ダイヤモンド社)は、アカデミズムを揺るがす「再現性の危機」について、なぜこのようなことが起きるのか、どうすれば防げるのかを詳細に論じている。

世界的なブームとなった「パワーポーズ」や「マインドセット」も再現性に疑問

 ハーバード大学の心理学者エイミー・カディが2012年に提唱した「パワーポーズ」は世界的なブームを巻き起こした。足を開いて両手を腰に当てるなど、力強さを表わすポーズを取れば、自信がついた感じがするだけでなく、テストステロンの値が上昇し、ストレスホルモンであるコルチゾールの値が低下するなどの生理的な変化が起きることが科学的に証明されたのだという(『〈パワーポーズ〉が最高の自分を創る』石垣賀子訳、早川書房)。

「マインドセット」も「恋の吊り橋実験」も「テレビゲーム依存症」も再現性に疑問。なぜ発表された学術論文の大半が誤りなのか?Photo:buritora / PIXTA(ピクスタ)

 カディの講演はTEDトーク史上2番目に多い7350万回以上視聴されたが、2015年に科学者のチームが「パワーポージング効果」を再現しようとしたところ、ポーズを取った本人はより力強さを感じたと報告したものの、テストステロンやコルチゾールの変化は確認できなかった。

 さらに2016年、パワーポージングの論文の筆頭筆者だったダナ・カーニーが「(もう)パワーポージング効果が本物だと信じていない」として、以下の誤りを自ら認めた。

・まとまった数の参加者を募り、途中で効果を確認した。すなわち、統計的に有意な結果が出るまでサンプルを追加しつづけた。
・恣意的に見える理由で数名の参加者が除外された。
・外れ値のデータポイント(極端なデータ)は、削除されたものも残されたものもある。
・複数の測定方法を使い、複数の統計的検定を実施したが、p値がもっとも低いものだけを論文で報告した(p値については後述)。
・パワーの自己評価に関して多くの質問をしたが、効果が見られたものだけを論文で報告した。

 こうして、「2分間のパワーポーズで人生が変わる」という大きな期待はあっという間にしぼんでしまった。“伝道師”であるカディはこれに反論するのではなく、「データの収集と分析の両方を主導した筆頭著者(つまりカーニー)の回想に……私が異議を唱えることはできない」と述べただけだった。

 パワーポーズと並んで大きな話題になった研究に、スタンフォード大学の心理学教授キャロル・S・ドゥエックによるマインドセットがある。考え方(心のもちよう)には大きく「成長マインドセット(しなやかマインドセット)」と「固定マインドセット(硬直マインドセット)」があり、子どもたちに成長マインドをもつよう指導したところ、驚くような成果があったという2008年の報告にアメリカ中(そして世界中)が沸き立った(『マインドセット「やればできる!」の研究』今西康子訳/草思社)。

 だがこちらも、2018年に300件以上のマインドセット研究のメタアナリシスが行なわれ、効果は実際にあったものの、生徒のマインドセットが成績の変動に関与する割合は約1%だった。さらには、成長マインドセットの訓練を受けたグループと、そうでないグループには96.8%の重なりが見られた。

「わずかでも効果があるなら、やらないよりもマシではないか」と思うかもしれないが、これはマインドセットの指導に教師や生徒のリソース(資源)が費やされていることを無視している。授業についていけない子どもに補習するなど、もっと効果の高い改善策があったとしても、それに割く時間がなくなってしまうのだ。

 うつや不安にしても、学力格差にしても、さまざまな要因がからむ複雑な事象で簡単な解決策はない。だが人間の認知能力には限りがあり、複雑なことを複雑なまま考えるのは不快なので、パワーポーズやマインドセットのようなわかりやすい話に飛びついてしまうのだ。

「再現性の危機」の震源地は心理学

「再現性の危機」はあらゆる学問分野で起きているが、その震源地は心理学だった。

 心理学は100年以上にわたって、「悲しいから泣くのか、泣くから悲しいのか」ではげしい論争を繰り広げてきた。前者はアメリカの心理学者ウィリアム・ジェームズが、後者はデンマークの生理学者C.G.ランゲが唱えたので、両者を合わせてジェームズ=ランゲ説と呼ばれる。

 脳と身体は双方向のシステムなので、どちらが正しいということはなく、脳の変化が身体に影響を与える(悲しいから泣く)ことも、身体の変化が脳に影響を与える(泣くから悲しい)こともあるだろうが、そうなるとランゲ説では、なんらかの方法で生理的な変化を起こせば(涙を流させれば)、それによって関連する感情(悲しさ)が生じることになる。これがプライミング効果で、先行する刺激が「呼び水(priming)」になって後続する感情や行動が引き起こされることをいう。

 よく知られたプライミング効果に、「恋の吊り橋実験」がある。男性の被験者が吊り橋を渡っていると、橋の途中で若い女性から心理学のアンケートに協力するよう頼まれる。そのあと「結果を知りたければ電話してください」と電話番号を書いた紙を渡すと、コンクリートの(揺れない)橋を渡った被験者に比べて、吊り橋を渡った被験者は、電話をした割合が5倍ちかくも多かった。これは、吊り橋が揺れるときのどきどき感を、恋愛のどきどき感に「帰属エラー」して、調査員の女性に好意を抱くからだとされた。

 1970年代に行なわれたこの有名な研究も再現性に問題があると批判されたが、その後の検証によって、吊り橋の途中で出会う女性が「若くて魅力的」であれば、一定の効果があることが確認された。だが逆に「魅力的でない」場合、こうした帰属エラーは起こらず、逆に不快感が強まるらしい(越智啓太『恋愛の科学 出会いと別れをめぐる心理学』 実務教育出版)。

「恋の吊り橋実験」のような心理学研究は印象的で、メディアなどで大きく取り上げられて研究所の実績になるので、その後もさまざまなプライミング効果が提唱されることになった。こうして、「あたたかな飲み物を手にもつとあたたかな気持ちになる」「交渉の際は、やわらかな感触のソファに相手を座らせると相手の態度が柔軟になる」「相手より物理的に高い位置に座ると、交渉が有利になる」「プレゼンの資料は重いものを用意する。ひとは重いものをもつと、それを重要だと感じる」など、さながら「プライミング効果バブル」の様相を呈した。

 行動経済学を創始したダニエル・カーネマンは、世界的なベストセラー『ファスト&スロー あなたの意思はどのように決まるか?』(村井章子訳/ハヤカワ文庫NF)で、倫理に反する行為のストーリーを書き写すと石鹸を買いたくなり、倫理に反する自分の行為を思い出すように指示されると、実験室を出る前に消毒液を使いたくなるという「マクベス効果」を例に挙げ、「信じないという選択肢はない。結果はでっち上げられたものではなく、統計的な偶然の産物でもない。これらの研究の主な結論が真実であることは、受け入れるほかはない。さらに重要なのは、それらの結論が自分についてもまた、真実であると受け入れることだ」と書いた。

 だがあらゆるバブルがそうであるように、やがてプライミング効果バブルもはじけることになる。