統計学の解説書でありながら、42万部を超える異例のロングセラーとなった『統計学が最強の学問である』。統計学に支えられたAIが広く活用されるようになった今、そのメッセージと知見の重要性はさらに高まっています。そしてこのたび、ついに同書をベースにした『マンガ 統計学が最強の学問である』が発売されました。本連載では、その刊行を記念し、『統計学が最強の学問である』の本文を特別に公開します。同書の出版は、統計学の魅力を広く伝えると同時に、「エビデンス」という言葉が社会に浸透するきっかけの一つにもなりました。(本記事は2013年に発行された『統計学が最強の学問である』を一部改変し公開しています。)

「エビデンス」が医療を変えた
「疫学」という、データと統計解析に基づき最善の判断を下そうという考え方は、スノウの発見から100年ほどかけて、医学の領域においては欠くことのできないものとなった。
現代の医療で最も重要な考え方としてEBM(Evidence-Based Medicine)、日本語にすると「科学的根拠に基づく医療」というものがある。この科学的根拠のうち最も重視されるものの1つが、妥当な方法によって得られた統計データとその分析結果というわけである。
スノウの疫学は基本的なデータの集計によってコレラのリスク要因を明らかにしたが、疫学の方法論は徐々に現代的な統計学の進歩を取り込み、より高度で正確なリスクの推定を可能にした。
人間の体には不確実性が多く、データを取って分析すると、生理学的な理屈のうえでは正しいはずの治療法が効果を示さないケースや、経験と権威にあふれる大御所の医師たちがこれまで続けていた治療法がじつはまったくの誤りだった、という事例が少しずつ明らかになってくる。
そのため、医師の経験と勘だけでなく、きちんとしたデータとその解析結果、すなわちエビデンスに基づくことで最も適切な判断をすべきだ、というのが現在医学において主流の考え方なのである。
なおこのEBMという考え方が世界的に広まったきっかけは1992年に公表された論文であり、現在責任ある立場で臨床を仕切っている医師たちの多くにとっては「学生時代にはほとんど習っていなかったこと」である。
医師に対する統計学の教育についてはアメリカですら課題が多いらしく、「研修医に基礎的な統計学のテストをした結果がたいへん残念なものだった」という研究がアメリカ医師会の刊行する学術雑誌に掲載されたこともあるくらいだ。現場レベルまでのEBMの徹底というのはまだまだむずかしいのだろう。
現場レベルではまだまだ課題が多いにせよ、医学において統計学的なエビデンスが最重要視されることに間違いはない。たとえば製薬会社が新しい薬を作ったときは、綿密に計画された研究方法で採取したデータに対して適切な統計解析を行なう。そしてその結果を厚生労働省に提出しなければ、新薬が認可されたり保険適用が認められたりすることはない。またその薬が市販されたあとも、製薬会社は少しでも自社の商品のウリを作るために巨額の研究費用を投じてエビデンスを作り、MRを通じて医師たちに売り込むのである。
前節で述べたように、エビデンスは議論をぶっ飛ばして最善の答えを提示する。もちろんデータの取り方や解析方法によって、どれほどのレベルで正しいと言えるのか、どこまでのことを正しいと主張して間違いがないのかは異なってくる。しかしながら、エビデンスに反論しようとすれば理屈や経験などではなく、統計学的にデータや手法の限界を指摘するか、もしくは自説を裏付けるような新たなエビデンスを作るかといったやり方でなければ対抗できないのだ。
教育にも活かされるエビデンス
こうしたエビデンスの強力さが少しずつ知られるようになると、その利用は医学だけに留まらなくなってくる。
たとえば近年アメリカの教育学界においては、さかんにエビデンスの重要性が叫ばれ、エビデンスに基づいた教育方法の評価が行なわれるようになってきている。
その最たるものは、ブッシュ政権時に成立した「落ちこぼれゼロ(No Child Left Behind)法」からスタートしたWhat Works Clearinghouse(WWC)プロジェクトだろう。
落ちこぼれゼロ法の中には、「不利な状況にある生徒への教育サービスの計画にあたっては、科学的根拠のある研究結果を考慮しなければならない」とか、「若者の暴力やドラッグを防止すると科学的に示された施策に予算を振り向ける」といったように、合計100回以上も「科学的根拠のある研究」という表現が登場するそうだ。
WWCプロジェクトは、こうした科学的根拠に基づいて教育プログラムを計画したり評価したりするために、これまで行なわれてきた教育関係の実証研究を片っ端から収集し、系統的に整理した。そしてその結果をインターネット上に公開することで「どのような教育方法が科学的に推奨されるのか」を明らかにし、全米の教育の質を向上させようとしたのである。落ちこぼれゼロ法という政策自体にはいくつかの問題が指摘されてもいるが、少なくともこうした科学的な姿勢を大々的に教育へ持ち込んだこと自体は大きな功績である。
不思議なもので、教育という分野に関しては、まったくと言っていいほどの素人でも自分の意見を述べたがるという現象がしばしばおこる。よっぽどアウトローな人生を送ってでもこない限り、先進国に住む人間のほとんどは何かしらの形で学校教育を受けているし、子どもが生まれればその教育をしなければいけない。
そのため、「自分が教育された」あるいは「自分が子どもを教育した」という個人的な経験のみから教育の良し悪しを判断し、意見するということがしばしば見られる。あるいは、ただ大学在学中に弁護士になったとか、子どもを全員東大に進学させたといった人の個人的な経験をありがたがって信頼するという人もいる。
だが、どのような教育がいいか、という問いへの回答は、教育される本人の特性や能力、環境などさまざまな要因によって左右されるし、医療と同様に不確実性の大きい分野でもある。自分が病気になったときに、まず長生きしているだけの老人に長寿の秘訣を聞きに行く人はいないのに、子どもの成績に悩む親が、子どもを全員東大に入れた老婆の体験記を買う、という現象が起こるのは奇妙な事態だとは思わないだろうか。
たとえば、
◆教師に生徒の成績に基づいた競争をさせて、ボーナスの査定にも反映させればいい
◆子どもは小学校入学前から英才教育を施すことで天才に育つはずだ
◆数学教育にもっとコンピュータを取り入れて効率化をはかるべきだ
など、さまざまなアイディアが、教育学者からも教育者からも、ただの素人からもしばしば提唱される。しかしながら、果たして本当にそれが正しいのかどうかは、結局のところデータと統計学の力を借りなければ誰にもわからないのだ。
ちなみに「教師に競争させてボーナス査定をする」というアイディアについては、2006年から2009年にかけてナッシュビル・パブリックスクールで延べ2万4000人の生徒と300人の教師を対象に実験が行なわれた。そして「統計学的に何の改善も見られないか、むしろ悪影響」という結果が得られている。
2番目の早期教育については、4700名の3歳から4歳までの子どもに読み書きと算数の早期教育を行なった結果、確かに3歳あるいは4歳の時点では、同年代の他の子どもと比べて読み書きや算数の成績が明確に高かったものの、小学1年生になった頃に追跡調査を行なってみると両者の差は消失してしまった、という統計解析の結果が得られている。
コンピュータを使った教育は、この3つのアイディアの中では唯一有望で、伝統的な授業を行なわれた生徒と比べ、統計学的に明らかと言えるレベルで数学の成績が上昇していたというI CAN Learnプログラムと呼ばれる取り組みも存在している。
もちろんアメリカ人の結果がそのまま日本人に適用できるかどうかは議論の余地があるが、このような教育方法のアイディアに関して有用性が判断できるようになったのも、統計学の力あってのことである。
野球にも経済学にもおよぶ統計学の影響
教育学に限らず、心理学にせよ、社会学にせよ、自然科学にせよ、仮説を検証しようとすれば、統計学の知識を用いて適切なデータを取り、解析することは避けることができない。
『マネーボール』という名の映画にもなった「セイバー・メトリクス」という考え方は、統計学をうまく使えば、貧乏球団でも大リーグにおいてプレーオフで優勝争いに絡めるということを示した。野球以外にもさまざまなスポーツにおいて、データ分析によって勝利を引き寄せるという試みがなされはじめている。
また、経済学でも長年、いくつかの仮定(人は合理的に行動するとか取引に必要なコストはゼロだとか)をもとに理論先行で数理モデルが考案されていたが、過去何百年にもわたる各国の経済に関するデータ(性年代別人口や国民の所得と貯蓄額、物価など)が電子的に収集・整理されるようになると、たとえば「経済成長が起こるかどうかはどう説明されるのか」といった問いに対する回答が、統計学的な解析を通じて明らかになってきた。
経済成長において重要なのは「技術の進歩」であり、さらに、技術の進歩に寄与する教育レベルや技術開発を行なった場合に、その利益が開発者に適切に配分されるかという「社会の制度」(たとえば特許制度など)であり、逆に天然資源の有無などが関連しているとは言えない、といったことが明らかにされてきたのだ。これもデータの整備と統計学的な解析によってはじめて可能になったことである。
もちろんマネジメントやマーケティング、イノベーションといった経営学の分野においても例外はない。
◆「よいリーダーシップとそうでないリーダーシップの違いはどこにあるか」
◆「どのようにすれば最も有望な市場セグメントを特定できるか」
◆「どのように研究職の社員をモチベートすれば技術開発が進むのか」
といった問いについて、世の上司やビジネス書の著者は勝手な持論を振りかざすばかりだが、これも教育学の例と同様、とっくに「現状で最善の答え」は統計学的に明らかにされているのである。
望むと望まざるとにかかわらず、ほとんどすべての学問に関わる学者は統計学を使わざるを得ない時代がすでに訪れているし、統計リテラシーさえあれば、自分の経験と勘以上の何かを自分の人生に活かすことがずいぶんと簡単になる。
統計リテラシーは、世界トップレベルの学者が長年の研究の結果明らかにした真実に直接アクセスすることを可能にする。この力があるかどうかでみなさんの人生が大きく変わることは間違いない。