統計学の中にある「最強」という概念

 「統計学が最強である」ことのもう1つの理由は、冗談でも何でもなく、統計学の専門用語として「最強」あるいは「最強力」という表現(英語ではmost powerfulという)が存在しているというところに由来している。この点については説明がややこしいので本書内では割愛したが、35万人もの日本人が統計学の本を手にとってくれるのなら話が通じるかもしれないのでこの場を借りて説明しよう。

 これは、イエジ・ネイマンエゴン・ピアソンという2人の天才統計学者によって考えだされた概念だ。ある統計手法が「最強」であるとはすなわち、「間違った仮説を採用してしまう確率を最低限に保ったうえで、正しい仮説を見落とす確率が最小のもの」であるという状態のことを言う。

 先ほどのCAST研究の例で言えば、「偶然これほど大きな死亡/心停止リスクの差が生じる確率は0.1%もない」という結果を提示されれば「不整脈の薬を飲むと死亡/心停止のリスクが上がる」という仮説を採択するのは人間の自然な判断である。しかしながら、厳密に考えれば「生じる確率としては0.1%未満ではあるが、たまたまデータにこうした偏りが生じただけかもしれない」という考え方を完全に否定しきることはできない。

 ネイマンとピアソンがこうした考え方をもたらした現代においても、慎重さや厳密さを重視するあまり、「必ずしもそうとは言い切れない」「これからも慎重な議論を」という毒にも薬にもならない物言いを好む有識者というのは数え切れないほどいる。「確率0.1%未満の奇跡的なデータの偏りが起こらなかったとは言い切れない」し、「本当に不整脈の薬を飲むことが悪いのかはこれからも慎重な議論が必要」というわけだ。

 間違ったことを言うリスクだけが問題なのであれば、慎重な姿勢で何も言わなければいい。だが、「不整脈の薬を飲むのが本当に悪いのか慎重な議論を」と言っている間に、日々不適切な治療によって死んでいく人は出てくる。これが教育なら不適切な教育のせいで読み書きが苦手なまま育っていく子どもが出てくるし、ビジネスだったら日々大きな機会損失が生じることになる。

 悠久の真理を紐解いてればいい学者と違って、我々の直面している問題の多くは、いまこの場で少しでも迅速に適切な意思決定をしなければ日々ダダ漏れの損失を抱えるようなものなのだ。

 ネイマンとピアソンが偉大なのは、慎重な人たちが戒める「間違った仮説を採用する」という間違いだけでなく、「正しい仮説を採用できない」という間違いについても同じくらい重視すべきだという新たな視点を世界にもたらしたことである。

 彼らが体系づけた統計学の考え方において、前者の「間違った仮説を採用する」間違いのことはαエラー、後者の「正しい仮説を採用できない」間違いはβエラーと呼ばれる。なお余談だが、日本の医療統計学の教科書では、頭文字と対応させてαエラーを「あわてんぼうの間違い」、βエラーを「ぼんやりの間違い」と覚えればいいと書いてあることが多い。

 αエラーとβエラーはおおよそトレードオフの関係にある。最大限の慎重さでαエラーの危険性を0にしたければ先ほどの有識者のように「毒にも薬にもならないことしか言わない」というやり方が考えられる。その一方でβエラーの危険性を0にしたければ「思いついた仮説は全部主張する」というやり方をとればいい。世の中で売られているビジネス書の多くはおそらくこういう考え方で作られているのだろう。

統計学は「不確かな現実」に判断を下すためにある

 だが実際のところ、我々はどのように判断を行なうべきなのだろうか。
それがネイマンとピアソンの主張する最強、つまり「間違った仮説を主張してしまう確率(αエラー)を最低限に保ったうえで、正しい確率を見落とす確率(βエラー)を最小化する」という考え方である。

 統計学では慣例的にこの「間違った仮説を主張してしまう確率」を5%まで許容する(分野によってはもう少し厳密さを求める場合もある)。「間違う可能性があるのかよ!」と思う人もいるかもしれないが、こうした統計学の考え方が存在していなければ、人類は未だに「絶対的に正しいこと」だけを求め、結局のところ「何も主張しない」か「正しいかどうかもわからないことを主張すること」しかできていなかったのだ。

 「絶対的に正しいこと」を扱うのならば論理学や数学に任せればよいが、そんなものは理論的な世界の中にしか存在しない。そして「少しでも絶対的ではないこと」について言及しようと思えば、現状、統計学以外に記述したり議論したりする方法が人類にはない。誤差を限りなく小さくできる物理学実験でさえその誤差は0ではなく、たとえば1kgという重さを全人類の技術の粋を尽くして厳密に定義した後、それでも残る50μgほどの誤差は結局のところ統計学的に記述されているのだ。

 人間や社会を対象とした仮説に言及するということになればなおさらその誤差は大きく、物理学などよりも遥かに長い間「厳密さを求めるあまり毒にも薬にもならないようなことしか言えない」か「正しいかよくわからないことを主張する」ことしか人類はできていなかった。

 だがいまは違う。やろうと思えば誰のパソコンでも統計解析は行なうことができるし、データを採取するのも、何ならRCTを行なうことだってそれほど難しいことではない。だからこそ統計学は、政治や経済、教育やビジネスといったありとあらゆる人間と社会を対象にした最善の判断を導き、価値を生むようになったのだ。

 私は大学を飛び出してからも自分自身を学者のはしくれだと思っているが、これからの時代の学者は、悠久の真実だけを追い求めて毒にも薬にもならないことだけを述べていては「ぼんやり」扱いされるのだろう。

 そんなわけで私は本書にこのタイトルをつけた。

 すべての学問領域の中で、「絶対的だが非現実的な理論」と「我々の不確かな現実」を繋ぎ、大きな価値を生み出すこの学問のことを我々はなんと呼べばよいだろうか?

 「最高の学問」というのはおそらく違う。「最善の学問」というのは正しいがあまりセクシーではない。「最もセクシー」というのも語呂が悪い。
だったら偉大なるネイマンとピアソンに敬意を払って、こんな仮説を主張してもいいはずだ。

 「統計学は最強の学問である」

 もちろん私は「間違った仮説を主張してしまう確率」について一定の覚悟をしている。


◆ダイヤモンド社書籍編集部からのお知らせ◆

『統計学が最強の学問である』 好評発売中!

統計学はどのような議論や理屈も関係なく、一定数のデータさえあれば最適な回答が出せる。そうした効能により旧来から自然科学で活用されてきたが、近年ではITの発達と結びつき、あらゆる学問、ビジネスへの影響力を強めている。こうした点から本書では統計学を「最強の学問」と位置付け、その魅力と可能性を伝えていく。

ご購入はこちら![Amazon.co.jp] [紀伊國屋書店BookWeb] [楽天ブックス]