2013年1月に発売されるや、ビジネス・経済書としては異例のベストセラーとなり、統計学ブームの端緒となった『統計学が最強の学問である』。同書の発刊1周年と30万部突破を記念して行われた、著者の西内啓氏と多摩大学情報社会学研究所所長・公文俊平氏の対談を前後編で公開します。
対談は公文先生の本質的な問いから始まり、統計学と経済学の哲学の違いへと話題は進んでいきます。(対談:2014年1月16日ジュンク堂書店池袋本店/構成:崎谷実穂)

統計学で「因果関係」がわかるのか

社会科学者から見た統計学<br />――公文俊平×西内啓【前篇】西内啓(にしうち・ひろむ)
1981年生まれ。東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバード がん研究センター客員研究員を経て、現在はデータに基いて社会にイノベーションを起こすための様々なプロジェクトにおいて調査、分析、システム開発および戦略立案をコンサルティングする。著書に『統計学が最強の学問である』(ダイヤモンド社)、『サラリーマンの悩みのほとんどにはすでに学問的な「答え」が出ている』(マイナビ新書)、『世界一やさしくわかる医療統計』(秀和システム)などがある。

西内 この対談は、『統計学が最強の学問である』が出版されてわりとすぐのころに、先生がツイッターで本書の感想をつぶやいてくださっていたことから実現しました。私は以前から先生の本の読者だったので、すごくうれしかったですね。

公文 今の時代、西内さんの本は多くの人に読まれるべきだと思いますよ。というのも、今はとかくビッグデータというものが万能視される傾向があります。WIRED誌の編集長だったクリス・アンダーソンは2008年に、「ビッグデータの時代においてはもう、仮説を立ててモデルをつくらなくても、コンピュータがデータの中からパターンや傾向、関係性を発見してくれる」という趣旨の発言をしました。研究者だけでなくビジネス畑の人も、ビッグデータで何かをしなければと思っていた矢先に、西内さんの本が過熱した論議に水をかけてくれたというか、いったん冷静になるための知識を与えてくれました。

西内 ありがとうございます。

公文 その上で今日まずお聞きしたいのは、統計学で因果関係がわかるものなのか、ということです。

西内 それはとても深い問題ですね。因果という言葉はもともと仏教用語からきています。前におこなった善悪の行為が、それに対応した結果になって表れるとする考えです。でも、原因があるから結果があるというのはどういうことなのか、考えれば考えるほどわからなくなります。

公文 ふむ。

西内科学者は最初、100回実験して100回同じ現象が起きたら、因果関係が確かめられると考えました。でも、それだけではうまくいかなくなり、「必ずしもAの結果になるわけではないけれど、Aの結果のほうに偏りやすい」というもう少しソフトな因果を考えた。それが統計学的な因果です。なので、統計学で因果関係がわかるのか、という問いに関しては、トートロジー(同義語反復)になってしまいますが「統計学的な因果はわかります」という回答になりますね。

公文 ああ、「コンピュータは知能を持つことができるか」という問いに対し、コンピュータができることを知能と再定義するようなものですね。

西内 そうですね(笑)。

公文私も仏教的な因果についてはわかりませんが、よく言われているのは、人間の進化の過程で、AのあとにBが起こった場合、AとBの間には関係があるという見方が備わってしまった、ということのようですね。だから、人間はなんでもすぐに因果関係として結びつけてしまう。しかし、Aが起こったあとに必ずBが起こることが確かめられたからといって、それがなぜ起こるのかはわかりません。説明するには別の理論が必要になる。

西内先ほど出た「ビッグデータですべてがわかる」という話を統計学的に解釈すると、A/Bテストやきちんとしたデータ分析手法を駆使すれば、点の因果関係が膨大なデータによって見つかりやすくなる、ということなんですよね。例えばある行動をよくする人の方がそうでない人よりも血圧が低いとか。こういう発見は、うまくデータを分析すれば結果として出てくる。でも、背景に線となる理論がないと、はたしてこのあとどう研究を進めていけばいいのかが見えてきません。理論があることによって、複数の点を線でつなげることができるようになるんです。