シリーズ47万部を突破した異例のベストセラー『統計学が最強の学問である』の著者・西内啓氏が、識者をゲストに迎えて統計学をテーマに語り合う対談企画。日本統計学会会長の岩崎学先生を迎えた後篇です。(構成:長谷川リョー/撮影:梅沢香織)

海外名門大学の統計学教育は?

西内 先生は統計学会会長ということで、しばしば海外の大学教育を視察されたり、学会に参加されたりしていますよね。そういった場で得られた知見はやはり大きいですか?

岩崎 この前、カリフォルニア大学へ視察に行ったのですが、バークレー校では学生全員に必修として、データリテラシーを教える取り組みを2年前からやっているんです。中身をみると統計学に加え、Pythonといったプログラミング言語を使った実践的な授業になっていました。

統計学者は人工知能ブームをどのように見ているのか?岩崎学(いわさき・まなぶ)
横浜市立大学国際総合科学群・教授/データサイエンス推進センター・センター長
成蹊大学理工学部・教授(併任)
1952年、静岡県浜松市生まれ。1977年、東京理科大学大学院理学研究科数学専攻修士課程修了。その後、茨城大学工学部情報工学科、防衛大学校数学物理学教室、成蹊大学理工学部情報科学科を経て、2017年より現職。2015年より日本統計学会会長を務める。理学博士。


――学生全員にPythonも必修はすごいですね!

岩崎 全米トップクラスの大学が、文理問わず全学的にそうした取り組みを行なっているわけです。彼らと戦うためには日本も統計教育、ひいては教養教育を見直す必要があるでしょうね。いずれにしても手を動かすこと、演習が大事になると思います。

西内 ビジネス書の枠を超えるので、自分が執筆できるものではないかもしれませんが、統計学の演習書も、最新の状況に合わせてガッチリと作り直した方がよさそうですよね。

岩崎 日本の統計学の教科書にも、アメリカのビジネススクールで使われているケースメソッドのようなものがあるとよいかもしれません。それをやるためには自分でプログラムを組まなければいけないので、自然とRやPythonが必要になってきます。知識がつくと同時に、自分で答えを見つけていけるような教材が必要ですね。
あとは先日、上海で5日間、統計学者の会議に出席してきました。中国のみならず、アメリカをはじめ世界中から人が集まり、毎日20もの平行セッションが行なわれていた様子を見て、世界の潮流を感じましたよ。

西内 逆にアメリカの大学なんかでは、中国系や韓国系の先生も多いですよね。

岩崎 それは中国人がアメリカに行ってしばらくたったら、母国から人を呼ぶからです。みんなその人のところに行く。バイオメトリクスなんかは、半分くらいが中国人じゃないでしょうか。中国人の名前はファンやチャンなどが多いので,覚えづらくて損をしている気がしますね。

 プリンストン大学に今井耕介先生がいますが、外国で活躍する日本人の統計学者は、まだまだ少ないのが現状です。でも、日本人は少ないので、目立ちやすいという意味で有利かと思います。「西内」なんて1人くらいでしょう(笑)。

西内 日本でも統計学関係では、1人しかいませんから(笑)。

岩崎 あとは去年参加した韓国・テジョンの統計学会で驚いたのが、若い人、そして女性の多さです。韓国の大学にはそれぞれ統計学科があって、さらに日本より遥かに多くのポストもあるんです。若い人と女性がいない組織は滅びます。その意味で若い人を育てていくことは本当に大事だと思いますね。

ボリュームゾーンとプロフェッショナルを
分けて統計学を広める

西内 あとは一口に統計といっても、数学やITを含めてどこまでやるのか、といった設計は重要だと思います。

岩崎 全員を押し上げることは理想ですが現実的には難しいので、そこは考えるしかありません。たとえば統計学を必修にすると、その単位が取れなければ卒業できないことになるので、レベルを下げざるを得なくなります。ボリュームゾーンを伸ばしていくのとプロフェッショナルを伸ばしていくのは両方必要ですが、分けて考える必要があるということです。それは英語の学習についても同じことが言えるでしょう。できる人をさらに伸ばすという視点も重要ですね。

西内 統計検定を実施されているのも、統計学会ですよね?

岩崎 統計学の裾野を広げるために2011年から実施しているのですが、西内さんが本を出版されたことによって、受験者を引っ張り上げていただいた気がします。

 それと連動しますが、今は次の世代を作っていくために、中学高校の先生のレベルもさらに上げたいと思っているんです。

西内 たしかに統計学を専門的に勉強したいと思ったときに、中高で習う数学がハードルになることが少なくありません。そこに先生の助けがあれば、かなりの人がつまずかずにすみますよね。

 じつは次に書く本は、そうした「数学」にフォーカスしようと思っているんです。自分の周りにも、大人になってから統計学や機械学習に興味を持って中高の数学をやり直そうとされる方がしばしばいるんですが、彼らにとってちょうどいい参考書があまりないようなんですよね。中高の数学には統計学でとてもよく使うものとそうでもないものが混在していますが、統計学の初学者がそこを区別することはできません。

――具体的には、どんな内容になるんでしょうか?

 たとえば、立体図形の表面積の求め方だとか、楕円を表す数式みたいな話は統計学とほとんど関係しませんし、三角関数自体が何かを理解することは必要ですが、トリッキーな公式の使い方などは統計学や機械学習の勉強とあまり関係しません。ものづくりのエンジニアを育てるための幾何学を含んだ数学カリキュラムと、それ以外の人のために統計学を理解するところをゴールに据えて内容を取捨選択した数学カリキュラム、という形で中高の数学教育は再設計された方がいいんじゃないかと個人的には思います。

 逆に、統計学でも機械学習でも、専門書を読もうとすると線形代数の記法に慣れておいた方が便利なので、行列の分野が高校数学のカリキュラムから削除されてしまったのは少し残念ですね。

統計学者は人工知能ブームをどのように見ているのか?西内啓(にしうち・ひろむ)
東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、 2014年11月より株式会社データビークルを創業。 自身のノウハウを活かしたデータ分析支援ツール「Data Diver」などの開発・販売と、官民のデータ活用プロジェクト支援に従事。 著書に『統計学が最強の学問である』『統計学が最強の学問である[実践編]』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある

統計学を学んだ人が
人工知能をカバーするために抑えるべきポイント

――最後に、統計学と人工知能分野との関係性についても教えてください。最近のAIブームには、統計学者の方もかなり関わっていらっしゃるんですか?

岩崎 いえ、そんなことはなくて、現時点では人工知能分野の中心は情報系やコンピュータサイエンスの人たちです。情報系の人たちが、人工知能の研究開発のために統計学をやり始めた、という方が正しいかもしれない。

西内 ただ、統計家である自分の仕事でもディープラーニングのような流行りの手法を扱うことがあるのですが、基礎体力のようなものを身につけさせていただいたおかげで特に苦労もしませんでしたね。

 研究の最先端でどのようなアプローチがなされているかという論文やプレプリントを探したり、そこに書かれている数理的な仕組みを理解したり、コードサンプルをいじって自分の目的に合う形で実行したり、というのは統計学者であっても日常的に行なう活動です。最先端の領域でも意外と古い教育といいますか、論文と数式の読み書きという基礎がとても役に立ちます。

岩崎 おっしゃる通り、基礎をしっかり身につけたうえで、変化にもついていくことが重要だと思います。流行だけを追っていると、それが終わった瞬間にダメになってしまうからです。たとえば、フロッピーディスクの研究者はいま何をやっているのでしょうか?

 変化に対応できる人を育てるために、教員としてはカリキュラムをしっかり作っていかなくてはなりません。とはいえ線形代数とかばかりでは飽きてしまうので、西内さんがおっしゃられるような実装とのバランスも大事になると思います。

西内 もう少し深掘りすると、統計学者が人工知能もカバーするうえでボトルネックになり得るのは、IT面で2つほどあるかもしれません。1つはプログラミングの手の早さ。そしてもう1つは画像や音声といったものも含めてデータがどのような形式のもので、どのように前処理をして分析まで持って行くかに関するノウハウですね。こうした部分に関しては、統計学だけをやっていても身につかないと思います。

岩崎 やはりその部分に関してこれまでの統計の人はちょっと弱いですね。統計の場合は、「データの分析をしてください」というところから始めますから。あとはやっぱり、自分でコードを書いてやるしかない。

西内 逆に機械学習を専門とする人たちは、統計的因果推論の考え方に弱く、概念として全く持っていないこともある。AIによって優良顧客になりそうな人を予測することはできても、どうやったら優良顧客を育てられるか、みたいな話との区別はあまりついていなかったりします。

岩崎 アメリカの大学の教科書なんかを見ると、「因果推論」は必ず入っています。実験や観察における相関や因果といった考え方を、大学1年生レベルで必ず学ぶんですね。この辺りはかなり重要です。人工知能であれデータサイエンスであれ、将来的にどこに進むとしても、統計学に関するキモはしっかり押さえてもらえればと思います。

(了)

統計学者は人工知能ブームをどのように見ているのか?