シリーズ38万部を突破したベストセラー『統計学が最強の学問である』の著者・西内啓氏が、さまざまなゲストと統計学をめぐる対談を繰り広げるシリーズ連載。新たなゲストとして、『統計学が最強の学問である[実践編]』の校正にも協力していただいた統計学者・岡田謙介氏を迎えます。
話題は「頻度論」と「ベイズ論」から、2人のバックグラウンドである「生物統計」と「心理統計」へ。両者の違いと共通点がわかる、希少な対談をお楽しみください
森鴎外と関係がある「日本に統計学者が少ない理由」
岡田 私がやっている心理統計は決して研究者の多い分野ではありませんが、西内さんのバックグラウンドである生物統計は、統計学の中では主流の1つですよね。とはいっても、日本ではまだまだ統計学の研究者の数自体が少ない。これはなぜでしょうね?
西内 他の国に比べて生物統計の研究者が少ない理由としては、明治維新からずっとドイツ医学を模範にしてきたことに原因があるように思います。というのも、生物統計学は英米系の大学を中心に発展しているからです。イギリス人のロナルド・フィッシャー(1890〜1962)、カール・ピアソン(1857~1936)とエゴン・ピアソン(1895〜1980)親子。それとイェジ・ネイマン(1894~1981)はポーランド系ですが、フィッシャーやピアソン親子のいたロンドン大で学んだ後、カリフォルニア大学バークレー校に招かれて統計学部を1955年に創立しています。この英米系の系譜が生物統計学の王道で、そこにはドイツはほとんど絡んでいない。
岡田 そうですね。
西内 もともとドイツでは、「病気というのは、病原菌やウイルスなど明らかな病原体が存在しているものである。だからミクロに観察し、基礎実験を繰り返せば原因がわかるはず」という考え方が支配的だったんですよ。このドイツ医学の「基礎研究至上主義」の発想が、その後の日本の医学にも影響を与えているように思います。森鴎外の『舞姫』だって、主人公はドイツに医学を学びにきたエリート学生でしょう。
岡田 ああ、そういえば。
西内 この森鴎外について面白い話があって。明治期、日本海軍の中で脚気がすごく流行って困ってたんですよ。そのとき、高木兼寛(たかぎ・かねひろ:1849〜1920)という、後に東京慈恵会医科大学を設立した海軍軍医総監がいたのですが、脚気対策として現在の考え方に近い臨床研究を行なっています。
岡田 へえ。どのようなことをしたのですか?
西内 2つの船で実験を行なったんです。片方の船では麦飯を食べさせ、副食も付けた。当時はまだビタミンという概念は発見されていないのですが、とりあえずバランスよく食事を摂るようにさせたんですね。もう片方の船では従来どおり、白米ばかりをたらふく食べさせてみた。「食べ物によって、脚気になるリスクがどれだけ違うか」を調べたわけです。すると、明らかに脚気の発症率に差が出た。
岡田 バランスよく食べさせたほうが脚気のリスクは減った、と。
西内 そう。そこで高木兼寛は「白米ばかり食べていたら脚気になる」と主張したわけです。ところが、当時、軍医としては高木よりも地位が上にあった森鴎外が「そんなことは認められない!病原体も特定されないのに非科学的だ!」と対立した。
岡田 鴎外は臨床データに価値を置かなかったわけですね。
西内 そうした経緯が、伝統的として日本の医学に残っているのかもしれない。あくまでも想像ですが。
岡田 なるほど。日本は、近代の大学システムを導入するときにもドイツを範にしていましたね。そうした歴史が、日本の医学の中で、データを元に考える統計学があまり重視されてこなかった根っこにあったのかもしれませんね。
「データのねつ造」を見破るのも統計学
西内 岡田さんのように、心理を対象とする場合、論文の再現性やデータの検証という点ではどうされているんですか? 他のサイエンスよりも評価が難しそうに思いますが。
岡田 心理学でも、「研究の再現性」が問題にされる機会が最近増えています。物理学や化学といったハードサイエンスと比べて、心理学のような人間を対象とする学問は厳密な統制が難しく、また個人差も大きいです。ですから、研究の再現は必ずしも容易でないこともある。しかし、それでも多くの研究者が繰り返し試みてやはり再現できないとなると、ねつ造が疑われてしまうでしょう。実際、たとえば社会心理学の分野で、再現できない研究が最近問題になりました。
西内 そういえば、有名な事件もありましたね。
岡田 オランダのステープルという社会心理学の重鎮によるねつ造事件ですね。直感と反して興味をひく多数の実験結果、論文を発表して名を馳せていたのですが、「サイエンス」誌に掲載されたものをはじめ50本以上の論文でねつ造が発覚しました。しかも、エクセルを使ってデータを1個1個、手作業でねつ造していたのだとか。
西内 ものすごく原始的なねつ造ですね。笑ってはいけないけれど(笑)。
岡田 面白いのは、そういうデータのねつ造を見つけるのも、統計学だということです。ねつ造したデータには、現実的にはあり得ない傾向が出ることがあります。たとえば、結果のバラツキが異様に少なかったりする。ただ、論文には平均値や標準偏差といった基礎的な結果は必ず書かれているので、その情報に基づいて同じ形のデータをコンピュータ上でランダムに作り、バラツキを計算する。それを何度も何度も繰り返すと、今回得られたぐらいバラツキの小さなデータが得られる確率を計算することができます。
西内 リサンプリング、ですね。
岡田 はい。そうすると、たとえば新薬の検証データなら、「こんなにきれいな結果が得られる確率は小さいじゃないか」とわかったりするんです。新薬の研究は何度も行ないますから、どの場合でもやけに結果のバラツキが小さいとなれば、これはまずあり得ない話だ、怪しいぞ、となります。
西内 統計学は騙せないぞ、と(笑)。
岡田 そうです。……そもそも、ねつ造って意味がないですよね。科学者は「本当のことを知りたい」という気持ちで研究をしているわけなので。もちろん、結果を出すことへのプレッシャーは私も感じますが、科学者としてねつ造は「やる必要がない」。
西内 その通りです。だいたい、ねつ造するためのダミーデータだって、つくるのはかなり大変な作業なんです。クリアすぎるデータになったり、逆にそれを避けようとすると狙った結果につながらなかったり。実は、ある本を書いたとき、分析用にそれらしいシナリオが浮かび上がるようなデータをつくろうとした経験があるのですが、それがもう大変で。ねつ造なんか絶対するかと、それならまともに調査した方が全然いいじゃないかと思いました(笑)。
岡田 実際に心理学でも、論文に報告されていた平均値と標準偏差を見て「怪しいぞ」と睨んだ研究者がもとのデータをもらったところ、本来あるはずのバラツキがなくきれいすぎる、ということでねつ造が判明した事例が複数起きています。