この対談記事は、7月に慶應義塾大学三田キャンパスで開催されたイベント「トップランナー2人が語る データサイエンス・統計学の最前線」をもとに作成されたものです。
社会科学分野、特に政治学でのデータ活用を牽引するハーバード大学教授・今井耕介氏と、ベストセラー『統計学が最強の学問である』シリーズの著者・西内啓氏が、世界レベルのデータサイエンス・統計学の状況を存分に語り合いました。お2人だからこそ話せるデータ活用の実態や統計学の学習法などについて、全4回でお送りするうちの第3回です。(構成:プレーンテキスト)
※イベントの全容はこちらのサイトで視聴できます。
理系と文系に垣根がある
日本のアカデミアの現状
西内:今井さんはアメリカで研究をされていますが、日本の政治学者の中でもきちんとデータ分析をしようという方々は増えてきているのでしょうか?
今井:そうですね。数はまだ少ないかもしれないのですが、若い世代の人たちはどんどんデータで研究をするようになっていますので、それが授業にも反映されるといいですね。そうでないと学生が育ちませんし、学生が育たないと院生が育ちません。研究者も育たないので、実務家も育たない。それが日本の課題かなと思います。
もう1つ課題だと考えているのは、日本の大学では文系と理系がはっきりと分かれてしまっているということです。それをどう変えていけばいいのかなと思います。西内さんの場合はどうでしょう? ずっと理系でおられたと思うのですが、文系に興味があったりはしませんでしたか。
西内:興味の方向は文系です。文系の勉強って、しやすいんですよ。いい教科書がたくさん英語で出版されているので、専門外のことであっても語学と統計学のことがわかってさえいれば、1冊読み込むと、どういう視点で考えているのか、先行研究でどういうものがあるのかを理解することができます。
ですので、理系、特に統計学の勉強をしておけば、つぶしが効くな……というのは個人的に感じています。
今井:それはありますね。ただ、日本の大学だと専攻を変えるのが非常に難しいですよね。私ははじめ法学部に入ったのですが、入学したあとに法学が大嫌いだと言うことが判明したんです(笑)。
こんなふうに、どこか行き場がないかなと思った時に、なかなかほかの学部に行きにくくなっていますよね。アメリカではそれがだいぶ柔軟で、プリンストン大学は最初は理系で入った学生は教養科目の1つとして文系の学問を取らなければいけないので、私の授業を取る人が多いのですね。そこで、実際とってみたらおもしろいということで、文系を専攻するようになる学生も多いのです。日本の大学にもそういう柔軟性がもう少しあればいいなと思います。
西内:東大はそこは恵まれているほうですね。前期課程は教養学部として他学部も含めたいろいろな授業を受けることができます。そこで心理学や社会学、経済学を勉強させていただいたのは今でも役に立っていると思います。
今井先生は、高校時代に数学が得意だったとおっしゃっていましたが、数学の入試がある文系の学部は少ないですよね。(プリンストン大学では)数学の素養が多少ある子が文系の学部に入ってきているというのは、もしかしたら多少は授業が教えやすいところがあるのでしょうか?
今井:アメリカでは、進学する高校によって教えていることが違ったりするので、数学がすごくできる学生もいれば、数字を見るのも嫌だという学生もいたりと、学生もいろいろです。
でも、データ分析というのは、本当に理解するためには数学を勉強しなければなりませんが、最初の入門的な部分は、自分でコンピュータを走らせて、データをアップロードして、それを分析していくところから入っていいと思うんですよね。それで、やってたらおもしろくなったから、ではもう少し数学を勉強してみよう、というふうになってもいいんじゃないかなと。
ハーバード大学政治学部・統計学部の教授。東京大学教養学部卒業後、ハーバード大学政治学部で博士号取得。近著に『社会科学のためのデータ分析入門』(岩波書店)がある。
日本とアメリカ 大学での教育現場の違い
西内:今井さんは東大でもデータ分析を教えられているんですよね。プリンストンの学生と東大の学生と比べてみて、違いはありますか。
今井:そうですね。東大でも2、3年前から兼任というかたちで、渡り鳥みたいに夏だけ来て教えています。東大の教え方は文科省の規制があるからか、学生はたくさん授業をとっていて、1週間に1回だけ受講するというやりかたになっています。ですが、そういうやり方だと深く教えることができません。
アメリカの大学では選択する科目数は少なくて、1つの科目に時間を費やすというかたちです。週1回の講義ではデータ分析ができるようにはなりません。実際にはコンピュータラボで20人ぐらいの学生を相手にデータ分析をきちんと教えていかなければならないと思いのですが、日本はなかなかそういう土壌になっていません。
西内:医学部の場合は、実習科目でこの日は半日これをやるというのが毎週あったりとか、または実験の技術を学ぶために、2カ月間ずっと同じ実習科目に専念することがあったように記憶してます。それで法律的には問題はなかったはずです。
今井:それはおもしろいですね。プリンストンでも実は理系と文系の授業は違うように組まれていて、理系にはラボという、実験などを3時間かけてみっちりやる授業があります。文系はそういう授業体制になってないのですが、3年ほど前からプリンストンでも私の教えている統計の授業では時間を延長しています。そのように、授業の体制も文系と理系を区別をしないでやっていくことが大事になってくるはずです。
西内:文系でもその形式はとり入れてほしいところですね。
今井:あとは、TA(Teaching Assistant)も必要で、そういう体制がないと難しいですね。
西内:私は先日青山学院大学で招聘準教授としてゼミ生を指導したんですけど、日本の私大文系はTAをおかずに教授の先生が細かい業務も自分で全部やられていて、大変そうですね。東大で理系だとプログラミングで困ったら院生の人に聞きなよ、みたいな文化があるんですけど、今井先生のところではいかがでしょう。
今井:そうですね。一番楽な講義は、証明を黒板に書いて、テストに出すから勉強してくるようにと言って、テスト問題を作ることなんですけど、実際にコンピューターでデータを分析できるようにしなさいって言うと、すべての学生ができるわけではありません。
たくさんの質問にも応えなければならないので、アメリカの大学でもこうした授業を教えるにはかなりの人力がかかります。そこでポスドクを増やしたり、TAの数を増やしたりするように大学に頼まなければいけない。ということで、それなりの予算がついてこないとデータ分析を教えるのは難しいですね。
西内:そうですね。特に、文系でプログラミング自体が人生初というような学生に「R」を教えないといけませんから。私は一時期いろいろな企業でRやPythonを教えていたのですが、皆さんびっくりするような間違いをするんです。コンマとピリオドを勝手に変えてしまう、みたいな(笑)。実際にPCの画面を見てみないと、なぜこの人が悩んでいるのか、わかりません。
今井:そのために、大学院生やポスドクの人を雇って、彼らに給料を出してあげるという体制を作っていかないと、なかなかデータ分析を教えるということはできないのではないかなと思います。
ただ、日本の学生は自習が得意ですよね。一生懸命自分でやろうとする。逆にそれを強みとして生かすことができれば、少ないリソースでも授業ができるのかもしれない、とも思います。
西内:今井先生が現在日本の大学で教えられている内容は、どれくらいのレベル感なのでしょうか。
今井:プリンストンでは今まで統計を全く触ったことがない学部生向きの授業で教えていて、数学も、微積や行列を知らなくても多少のアルジェブラ(代数学)ができればいいというレベル感なのですが、東大で教えているのはPh.D.に行きたいという学生向けなので、それよりもかなりレベルが高いものになっています。
いつも学生には、まずデータ分析で実践的な研究をして、それでほんとにおもしろいと思ったら数学を少し勉強するようにとアドバイスをしています。正攻法で行けば、まずは数学、次に確率、それができたら統計論、最後にデータ分析を勉強するという順番になるのですが、私は、何もわかっていなくても、まずはとにかくデータを分析してみて、これがおもしろいと思ったら深く理解するために数学を勉強するというふうに、順序を全く逆にしています。
統計家。東京大学医学部卒業。著書の『統計学が最強の学問である』シリーズは計49万部のベストセラーとなり、日本統計学会出版賞を受賞。現在は株式会社データビークル代表取締役として、拡張アナリティクスツール「dataDiver」などの開発・販売、官民のデータ活用プロジェクト支援にも従事している。横浜市立大学客員准教授、青山学院大学招聘准教授も兼任。
データ分析を学んだ学生の就職先は?
西内:2、3年ぐらい教えられていると、ぼちぼち卒業生が出てきますが、皆さんの進路はいかがでしょうか。
今井:そうですね。アメリカでは昔は、政治学を専攻すると法学部やロースクール、コンサルティングファームに行く人が多かったのですが、いまデータ分析できる力を持っている学生は、FacebookやGoogleなどのIT企業にも就職しています。FacebookやGoogleはもちろんエンジニアが必要ではあるのですが、どういうシステムを作ったらいいか、システムを評価するにはどうしたらいいかということで、社会科学の知識を持っている学生を必要としているのです。GoogleもFacebookも、お客様は人間なので、人間の行動を理解しないとどのようなシステムを作ったらいいかわからないのです。
ということで、昔は政治学部の学生は就職ができるかどうか心配されていたのですが、最近ではいろいろな選択肢が出てきました。
西内:私は「コンサルタント側のデータサイエンティスト」と「エンジニア側のデータサイエンティスト」と区別をしているのですが、日本ではこれがまだごっちゃになっていて、数学が得意なポスドクさえ採用すればデータサイエンスの仕事はなんでもできると思っている人も少なくありません。しかし、その人たちには人間を対象にしたセオリーの部分が足りません。心理学でも教育学でも、基礎理論がない状態でマーケティングのことを考えてくださいと依頼すると、数学が得意でプログラミングができたとしても大したレポートが出てこなかったりします。逆にずっと文系でSPSS(IBMの統計解析ソフトウェアの製品群)を使ってましたという人が、いきなり機械学習のことを覚えるよう会社に言われたものの、画像データをどう扱っていいかわからなくて困るということもあります。
アメリカでは文系側でもデータサイエンスを勉強したというキャリアパスができているのは非常によいことですね。 (続く)