2013年1月に発売されるや、ビジネス・経済書としては異例のベストセラーとなり、統計学ブームの端緒となった『統計学が最強の学問である』。同書の発刊1周年と30万部突破を記念して行われた対談の2人目のゲストは、楽天株式会社でデータサイエンスチームを率いる執行役員、北川拓也氏。ふたりは、北川さんがハーバード大学大学院で理論物理学を専攻していたときから友人関係とのこと。そんな北川さんは『統計学が最強の学問である』を読んでどう感じたのか。本書を起点に、物理学と統計学の関係を探ります。(対談:2014年1月22日/構成:崎谷実穂)

「シムシティ」と「三国志」が統計学の入り口に

北川 僕が『統計学が最強の学問である』を読んで思ったのは、データをどう扱うべきか総合的に教えてくれる本だなということ。いろいろな学問の観点を入れて書かれていますよね。

物理学者から見た統計学<br />――北川拓也×西内啓【前篇】西内啓(にしうち・ひろむ)
1981年生まれ。東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバード がん研究センター客員研究員を経て、現在はデータに基いて社会にイノベーションを起こすための様々なプロジェクトにおいて調査、分析、システム開発および戦略立案をコンサルティングする。著書に『統計学が最強の学問である』(ダイヤモンド社)、『サラリーマンの悩みのほとんどにはすでに学問的な「答え」が出ている』(マイナビ新書)、『世界一やさしくわかる医療統計』(秀和システム)などがある。

西内 そうだね。統計学は生物学、疫学、経済学、社会科学など、さまざまな学問と接点があり、それぞれ使われ方も違う。それを説明した上で、統計解析でわからないことは定性調査をした方がいいということも書いている。そこが従来の統計学の本と違うところかもしれない。

北川 調査・分析のうまい組み合わせ方を考えろ、ということですよね。あとは、ストーリーや具体例がおもしろくて、理解しやすかったです。あみだくじで勝つ方法やIQがどういう成り立ちの指標かなど、知らない例がたくさんありました。この本を読むことでいろいろな興味が広がります。啓さんって、もともとなぜ統計学に興味をもったんですか?

西内 統計学というか、データを見て意思決定するくせが身についたのは、学生の頃やってた「シムシティ」かもしれない(笑)。交通渋滞のパーセンテージが上がってるから、その原因をなんとかしないといけない、とかずっと考えてたから。

北川 そのときからデータを見て、因果関係を考えてたんですね(笑)。

西内 あと、「三國志」のゲームもよくやってたんだけど、今考えてみると「忠誠度98」っていう表示とかすごく気になる。何をもって三国志の時代に忠誠心を数値化していたのか(笑)。

北川 本気で調べるなら、IQで知能を数値化したような作業が必要でしょうね(笑)。

西内 意外なところに統計につながるおもしろいデータってあるんだよね。学校で習う統計学の授業って数学的な確率論の説明から入るのが定番なんだけど、この本はランダム化比較実験の紹介から入るようにしたんだ。あとこの本が通常の統計学の本と違うのは、歴史を紐解いて説明しているところかな。

北川 啓さん、歴史好きですよね。

西内 昔から好きだったんじゃなく、この本を書いているうちに歴史を参照するのがくせになったんだよ(笑)。「なぜこの解析手法が生まれたんだろう」というルーツを調べていくと、100年ほど前の文献にたどり着いたりして、古い論文をたくさん読んだな。歴史とストーリーがわかると、数理的にやろうとしていることもイメージしやすくなるからね。

北川 人の購買行動について考えるときも、購買回数や金額からモデルを立てて影響がありそうな変数を推察するという考え方もできますが、各購買経験から積み上げていくことで、もう少し正しく推測することができる。ストーリーの組み立てを個別にやらないと、人間の行動は理解しづらいんですよね。歴史にあたるというのは世界最初の具体例からたどるということだから、理解しやすいのかなと思います。

西内 それはあるかもしれない。現在使われてる複雑なモデルでも、100年前の最初に誰かがつくったときは、意外とすごくシンプルな思いつきからできてることがある。それは高校生でも聞けばぎりぎり理解できるような内容だったりするんだよね。