「183件論文を撤回した日本人」その衝撃の“データ捏造”の実態とは？

2024年2月8日 4:12

「すべての科学研究は真実である」と考えるのは、あまりに無邪気だ――。
科学の「再現性の危機」をご存じだろうか。心理学、医学、経済学など幅広いジャンルで、過去の研究の再現に失敗する事例が多数報告されているのだ。
鉄壁の事実を報告したはずの「科学」が、一体なぜミスを犯すのか？
そんな科学の不正・怠慢・バイアス・誇張が生じるしくみを多数の実例とともに解説しているのが、話題の新刊『Science Fictions　あなたが知らない科学の真実』だ。
単なる科学批判ではなく、「科学の原則に沿って軌道修正する」ことを提唱する本書。
今回は、不名誉な世界一の称号を持つ「183本の論文を撤回した男」についての本書の記述の一部を抜粋・編集して紹介する。

Photo: Adobe Stock

「不正を繰り返していた日本人」をあぶり出した手法とは？

数値の間違いは、はるかにリスクの高い科学分野でも、不安になるほど多く見られる。

先に紹介したとおり、世界で最も多くの（あくまでも本書の執筆時点で最も多くの）科学的不正をおこなってきたのは、麻酔科医の藤井善隆だ。（過去記事はこちら）
藤井が長年手を染めてきたデータ捏造。これに終止符を打ったのは、同じ麻酔科医のジョン・カーライルだった。

彼は、「ランダム化（無作為化）試験が本当にランダム化されているかどうか」を確かめる統計手法を考案した人物である。

ランダム化のプロセスに着目して分析する

ランダム化比較試験では参加者のグループ分けに際し、前もって用意した方法でランダムに振り分ける。
（たとえば、治験薬を投与する群と、プラセボを投与する群に分ける時に、参加者がそれぞれコインをはじくなど、つまりバイアスの影響を受けていない方法で振り分ける）。

このグループ分けのプロセスはとても重要だ。
特に、試験を始める前に（専門用語で「ベースラインにおいて」）グループ間に大きな違いがないことを確認しなければならない。

一方のグループのほうが健康である、教育水準が高い、年齢が高いなど、結果に影響を与える可能性がある要素について著しく異なる場合、公正な試験とは言えない。
したがって、ランダム化比較試験の最初の段階で複数の群のあいだに”大きな違い”が存在する場合、ランダム化のプロセスが失敗したのではないかという問題が生じる。

反対に、複数の群が完全に一致している場合も同様だ。あらゆる数字にはノイズが含まれるという鉄則を不可解にも回避している場合も問題がある。
ランダム化をおこなった後でも、群のあいだにわずかな差が偶然、生じると考えられるからだ。カーライルの分析手法はこの点に注目している。

藤井のデータが手に入る確率は「10の33乗分の1以下」

そして、藤井の論文を100本以上チェックしたところ、データが信じがたいほど完全に一致していた。

たとえば、試験対象の患者の年齢、身長、体重の分布はほぼ完全に一致していた。
このような偶然が現実に起きる確率は10の33乗（1兆×1兆×10億）分の1以下である。
予想どおり、藤井は詐欺師であることが判明した。

2017年にカーライルは、8つの学術誌に掲載された5087件の医学的な臨床試験にこの間違い探しの手法を用いて、欠陥のあるランダム化や疑わしいほど完璧なランダム化をあぶり出した。

結果が無意味になったかもしれない試験が“数百件”存在する

もちろん、運悪く疑わしいと見えるだけの試験もあるだろう。しかし、その点を考慮しても、調査した試験の5％に疑わしいデータが含まれていることがわかった。

グループを適切にランダム化しなかったために試験が完全に汚染されて、結果が無意味になったかもしれない試験が数百件、存在するということだ。

藤井のような不正はこうした破綻のごく一部にすぎず、カーライルが発見したのは、基本的に故意ではない間違いだったと思われる。

とはいえ、医師が患者の治療法を選択するために結果を利用するという医学的な試験の重要性を考えれば、そうした無邪気なミスが非常に深刻な事態につながる。

（本稿は、『Science Fictions　あなたが知らない科学の真実』の一部を抜粋・編集したものです）