メンデルのねつ造は仕方がなかった!?

「心理統計」の学者と<br />「生物統計」の学者が対談したら 西内啓(にしうち・ひろむ) 東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2014年11月より株式会社データビークルを創業。自身のノウハウを活かしたデータ分析ツールの開発とコンサルティングに従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。

岡田 そうそう、生物学で有名なメンデルの論文にも、ねつ造疑惑がありますよね。データがきれいに揃いすぎているんです。フィッシャーは「メンデルは自説に都合のよいデータの選別を行なっていた」と指摘しています。

西内 メンデルの場合、導き出した結論は合っていると思います。けれども、実際の実験ではもっとノイズがあったはずなんです。私もそのエピソードは本に書いたのですが、一応弁護しておくと、当時は「カイ二乗検定」なども知られていない時代なので、正直にノイズの多いデータを発表していたら「本当にそうだと言いきれるほどのデータか?」で終わってしまい、歴史上メンデルの法則の再発見が遅れてしまっていたかもしれません。

岡田 統計的にデータを分析すると役に立つ、ということは、メンデルのような19世紀の科学者は必ずしも理解していなかったかもしれません。昔の学会発表では、まず自分の説を述べ、その説の正しさを示す最もきれいで代表的なデータを示す、というのがお作法だったこともあるそうです。科学者の間でも、データの扱い方の「常識」って時代によって違いますからね。論文を書くにあたって統計分析をきちんとするようになったのは、フィッシャーの『研究者のための統計的方法』が出版された1925年以降のことです。

西内 『研究者のための統計的方法』、実験のバイブル本ですね。

岡田 そうですね。この本がベストセラーになり、世界中の研究者に読まれたことによって、「ランダムさこそ、真実のデータの証し」と認識が変わっていったのです。

扱うことのできるデータの数は分野によってかなり違う

西内 そういえば、かねてから脳科学分野のデータで疑問に感じていることがあるんです。

岡田 なんでしょう?

西内 装置自体は非常に高度なものを使っているのに、2、3人のサンプルで比較しているものがある、という点です。ありとあらゆる違いが、たった2人の比較から導き出されていて……。

岡田 ああ、非常に稀な疾患の場合などは、多くの人からデータを取れませんからね。そういうときに使うための、1人を何回も測定して行う研究方法が開発されています。アメリカの心理学者で行動分析学を創始したバラス・スキナー(1904〜1990)が確立した、「単一事例実験」です。A-Bデザイン、A-B-Aデザイン、A-B-Cデザインなど目的に応じた研究デザインがあります。たとえば薬を飲んだときと飲まないとき、さらに飲んだときと飲まないとき……というふうに条件変えつつデータの測定を繰り返して、個人の中で意味のある効果と誤差とを分離します。

西内 多数のサンプルをランダムに取る手法とは根本から違いますね。

岡田 ええ、その通りです。もちろん測定対象の数が少ないのだから、結果をどのぐらい一般化できるのかという批判は常にあります。しかし、ある個体からの測定値はたくさん得られるので、こうした研究が蓄積されれば、また研究をたくさん集めてメタ分析をすれば、より確実な知見が得られることになります。最近心理統計の分野では改めて見直されていますね。この方法、医学のほうでは別の名前があると聞いていますが……。

西内 クロスオーバー試験のことでしょうか。クロスオーバー試験は、単一の事例実験ではなくてある程度はサンプル数を増やすかな。けれども、根本的にはよく似ています。たとえば、ランダムにAグループとBグループに分けたあと、Aグループは先にクスリを飲んでもらい、あとでプラセボを飲む。Bグループは先にプラセボを飲み、次にクスリを飲んでもらう。その差分が「効果」だという比較実験ですね。個人差に関するバラつきが制御できる分、サンプル数が少なくても検出力が高くなるという方法なので、岡田さんの話にあった単一事例実験に近いのではないでしょうか。 

岡田 そうですね。また、こうしたデザインは「個人差が小さいだろう」と考えられる分野ではとくに有効です。たとえば視覚。心理学の扱う現象の中では、ものの見え方というのは、個人差があまりないと考えられています。また知識の影響も受けにくい。たとえば、錯視(錯覚)は、「オレは騙されないぞ」といくら頑張ってみても、見えてしまうんです。こうした分野では、1人につき3時間ぐらいずっと実験して、データポイントの数を多くすることはあります。

西内 生物統計学の研究でも、実験動物10匹を2グループに分けて5匹ずつで有意差を出す、というような状況で用いる手法や注意点について、生物実験系の統計学の教科書には、しっかりと書いてある。

 けれども、そのような少数データを扱う際には重要でも、初めから数千人分のアンケート調査や顧客データを分析する人にとっては気にしなくていいことってけっこうありますよね。多くの教科書がそうした「気にしなくていいこと」も細々と書いているせいで、結果として学習のハードルを上げてしまっている側面もあります。数百、数千のデータを扱う人には、これだけわかってれば十分ですよ、という本もあっていいのではないかと思いました。

岡田 たしかに、扱うことのできるデータの数は分野によってかなり違う。それなのに、統計学の本では、その辺はあまり意識されずに書かれているかもしれません。

 そういった実務的な考えで書かれたのが、今回のご縁ができた『統計学が最強の学問である[実践編]』でしたね。たいへん面白く読ませていただきましたし、今日のお話も楽しかったです。ありがとうござました。

西内 こちらこそ、統計学について楽しいお話しができました。ありがとうございました。

(記事転載元/ダイヤモンド社書籍オンライン 2015年3月5日掲載「『統計学が最強の学問である[実践編]』発刊記念対談」第9回)

【特別対談】西内 啓×専修大学・岡田謙介准教授
第1回 「頻度論」の学者と「ベイズ論」の学者が対談したら
・第2回 「心理統計」の学者と「生物統計」の学者が対談したら