この対談記事は、7月に慶應義塾大学三田キャンパスで開催されたイベント「トップランナー2人が語る データサイエンス・統計学の最前線」をもとに作成されたものです。
社会科学分野、特に政治学でのデータ活用を牽引するハーバード大学教授・今井耕介氏と、ベストセラー『統計学が最強の学問である』シリーズの著者・西内啓氏が、世界レベルのデータサイエンス・統計学の状況を存分に語り合いました。お2人だからこそ話せるデータ活用の実態や統計学の学習法などについて、全4回でお送りするうちの最終回です。(構成:プレーンテキスト)
オバマ大統領の選挙戦を支えた
データサイエンティスト
今井:ほかにもいろいろな分野でデータが使われていますね。オバマ大統領は2004年頃からデータサイエンティストを採用して、どういった有権者にアプローチしたらいいか、どういった広告をどの地域のテレビ局で流したらいいかなどを分析していました
世界銀行やアメリカの官僚組織の中でもデータサイエンティストのポジションがあり、政策評価をしています。ニューヨークタイムスなども、ジャーナリズムを専攻していた学生がデータ分析の力があるからということで、データ収集をして簡単な分析をするようになっていますね。
西内:オバマ大統領が選挙戦の前半、ダイレクトメールで寄付を呼びかけた際に、黒人の既婚女性に対してはバラク・オバマの名前ではなく、ミシェル・オバマの名前で「夫を助けてください」と送るパターンがあって、その効果がランダム比較実験により実証されたために、大規模に送るようになったという話を聞いたことがあります。
今井:アメリカの選挙戦はかなりデータを活用していて、日本とは大違いです。
西内:日本の場合は世論調査ですよね。実は、私はこっそり選挙期間中のメディアの調査を手伝っていたことがあったのですが、有権者が認識している政策課題の重要性の違いによって、支持政党が変わるという明確な関連が見つかったりします。
今井:今のアメリカの政治で1番顕著な例は選挙区の区割りをどうするかという話です。区割りが憲法に違反するかどうかという訴訟がいくつか最高裁まで上がってきています。
見た目は普通の自然な選挙区に見えるのですが、よく見てみると黒人を1つの選挙区に固めたり、民主党の支持者をいろいろな選挙区に配置するとか、そういうことができてしまう。このようなケースの訴訟では、政治学者が裁判に呼ばれて裁判官の前でデータ分析の話をするようなことがあります。ところが、裁判官がデータを読むことができないと、合憲かどうかの判断をする際にエビデンスを評価することができません。ですから最近は、ロースクールでもきちんと統計を教えようという雰囲気ができてきていますね。
このように、ジャーナリズムや法律の世界のように、今までデータとは無縁だったようなところでも、だんだんとみんなデータを使いはじめています。
西内:日本の公害訴訟なんかでも、この公害がどれぐらい健康被害になるのかという言うことを、医学のデータを使って議論されたことがありました。
ただ日本では、法律家の方々のほとんどが全くデータ分析を勉強したことがないんですよね。先日、通信販売の業界団体の講演でデータ分析のお話をしたときに、理事のボードメンバーに入っていた弁護士の方から、広告表示の優良誤認について、このメッセージを多くの人がどういうふうに受け取るかという話を、何人ぐらいで調査すれば、それを相当な証拠として採用することができるのかということを質問されました。どこから統計調査に手をつけていいのかまったくわからないような印象でした。日本では、法学部で統計学を教えられていないがために、データで実証をするためのノウハウが法律家の先生方に備わってないのではないかなと感じています。
ハーバード大学政治学部・統計学部の教授。東京大学教養学部卒業後、ハーバード大学政治学部で博士号取得。近著に『社会科学のためのデータ分析入門』(岩波書店)がある。
ビジネス界では
データサイエンティストの争奪戦に
今井:世界の企業がデータ分析をできる学生を必要としていますが、日本ではどうなんですか。
西内:日本でも、企業はデータ分析ができる学生を必要としています。さらに、データ分析ができる人は争奪戦になっていて、日本にいる外資系企業も、高い給料を払ってでもデータ分析できる人を採用したいと考えています。そうすると、日本のメーカーがデータ分析をしていた人材をがんばって採用しても、就職して実務経験を3年ぐらい積むと外資系企業から高い年収を提示されて転職されてしまうのですね。
今井:私としては企業で必要としているなら、どうして大学でどんどん勉強するようにならないのかということが疑問です。アメリカの場合は、社会がデータサイエンティストを必要としているということを、学生が感じるんですよね。そして、学生の要請に教員が応えるかたちでカリキュラムが組まれていくのです。もし日本の社会がデータ分析を必要としているのであれば、なぜそれが大学を変えるプレッシャーにならないのかと感じます。
西内:そこはもしかしたら、大学側と企業側のコミュニケーションがうまくいってないのかもしれません。最近人事関係のデータ分析もお手伝いしていて、いろいろな企業の人事関係の責任者とお話をするのですが、面接時の自己アピールで何をがんばりましたかと聞くと、これまではバイトのリーダーのエピソードが多かったんですけど、最近はそうではなくて、学生時代にRの勉強してましたというのが増えてきていると。そして、実際に面接でそのようなことを言うと、企業はデータ分析できる人材が欲しいので採用に有利に働くそうです。
このように、どんどんデータサイエンティストの需要が伸びてきていて、学生もそれを敏感に察知しているようです。
統計家。東京大学医学部卒業。著書の『統計学が最強の学問である』シリーズは計49万部のベストセラーとなり、日本統計学会出版賞を受賞。現在は株式会社データビークル代表取締役として、拡張アナリティクスツール「dataDiver」などの開発・販売、官民のデータ活用プロジェクト支援にも従事している。横浜市立大学客員准教授、青山学院大学招聘准教授も兼任。
実社会にアジャストする
人材を育成する工夫とは
今井:それで思い出したのが、プリンストン大学で教えていた授業の中で、ただ単に授業でデータ分析を教えるのではなくて、実社会でデータ分析をしてる人に話をしてもらおうと考え、Googleからやニューヨーク・タイムズ、プロスポーツチームからデータサイエンティストを呼んでプレゼンをしてもらいました。
私よりめちゃめちゃおもしろいプレゼンをしてくださって、それが学生にはかなり新鮮だったようです。自分もこの分野でデータを使ってやっていきたいという学生が現れ、このような授業が大学と大学の外との交流を促すきっかけになると感じましたね。
西内:データサイエンスを教えるにあたり、文科省からも実務的な人材を育てなさいというようなプレッシャーがあって、そのようなプログラムがあったりはします。
私は現在横浜市立大学で、プロジェクトベースドラーニングをお手伝いしています。その中で私のミッションは、企業側から実際のデータをいただいて、学生にその企業のビジネスにそったデータ分析や新規の調査設計をしてもらうこと。課題を解決するまでの一連を経験しようという狙いです。
※プロジェクトベースドラーニング=複雑な課題や挑戦しがいのある問題に対して、生徒が少人数のグループでの自律的な問題解決・意志決定・情報探索などを通じて解決を目指す学習方法
今井:それはいいですね。学生も勉強になるし、企業としてもデータ分析をしてもらえるじゃないですか。
西内:企業側としても、これで人材を青田買いできればシメシメみたいなところもありますね(笑)。データ分析を用いた企業の課題解決を大学が手伝えば、大学にとっては研究や教育のお題になりますし、企業にとっても学生にとってもいい勉強になります。キャリアのきっかけになる人も出てくるのではないかという気がします。
今井:学者としては学問のおもしろさを教えることが1番大事だと思うのですが、授業をとっている学生のほとんどの人は学者になるわけではありませんので、教えたことが実社会にどのように反映されているのかということも、学生にとって重要だと思います。
最近では、社会科学だけでなく文学や哲学を勉強している学生にとっても、データサイエンスは重要になってきています。この間プリンストン大学で『AIとエシックス』という学会がありまして、AIの技術の進歩にどのような道徳的な意味があるのかというテーマで、哲学を勉強してる人たちとAIを実際に開発しているエンジニアの人たちが意見を交換しました。そういう話を聞いていると、GoogleとかFacebookの人は、哲学のPh.D.を持っている人も必要としているのだなと思います。
以前、GoogleのAIが写真判別で、黒人とゴリラを間違えたということがありました。そのようなことがないようにシステムを作るということは可能なんだけれども、作る側はそこまで考えていない。だから、実際にはプログラミングができるわけではないけども、そういうことを考えられる人材が大事ということで、いろんな分野でデータ分析ができる人が必要になってくると思います。
西内:いまAIの話が出ましたが、多くのビジネスマンたちがAIに興味を持っています。たくさんの人たちが「すごいらしいぞ」と思っているのですが、統計学を数学的側面からもわかっている人間からすると、今流行りのディープラーニングをはじめとする統計的機械学習は謎の新技術などではなく、回帰分析という大学1年生でみんなが習う技術の延長上にあることがわかるじゃないですか。このように、データ分析に関する知識があった方が、過剰な期待もせずに、過剰に恐れもせずに、変に騙されないのではないかと、個人的には思っています。
企業にとって
データ分析の投資効果は「13倍」
今井:そうですね。世の中でAIと言われていることは、実はただ単に回帰分析だったりしますので、AIと呼ばれているものがすべてAIではないと思うのですが、因果推論をずっと勉強していたジュニア・パーという有名なコンピューターサイエンティストが言うには、AIも因果推論が分かるようにならなきゃだめだと。なぜかというと、人間の思考というものは、実は因果推論によってできていて、ある事象についてこれを引き起こしたのはなぜなんだろうということを、いつも考えるようになっているというのです。
それをもし人工知能が考えられるようになったら人間に近づくのではないかという話もしていました。そういう意味では、先ほども因果推論は社会科学にとってとても重要だという話をしたんですけど、人工知能にとっても必要となるものなのですね。
西内:そうですね。人間は「赤いパンツをはいたら元気になる気がする」みたいなことまで因果関係をなぜか考えてしまう。それをちゃんとデータを使って補正して、因果推論に近づいていくということですね。
因果推論がわかってない状態で、AIによる予測を用いるときに起こる問題が1つあります。たとえば、お店の販売データを使って機械学習で優良顧客を予測して、ダイレクトメールを送るという会社があるんですね。本来でしたらダイレクトメールを送ったか否かによってどれだけ売上が変わるかという因果関係をを検証しないといけないのですが、実際現場で行われているのは、放っておいても来店する優良顧客に対して10パーセントオフのクーポンを送ってしまうということです。そうすると最悪の場合、優良顧客はクーポンをもらったからといって多く買うわけでもなく、値引きの分売上が10%減ってしまうだけかもしれない。
一方で、ひょっとすると「有料じゃないお客様」の中にも、10パーセントオフにすることで来店して、より多くの利益をもたらしてくれるお客様もいるかもしれませんが、優良顧客にばかり目がいって、本来取るべきデータが取れてないということが結構あったりするんですよね。
今井:そうですね。いろんな技術が進んでて、AIの技術が進んでたり、統計の分野も毎日日進月歩で進んでいて、私なんか研究者でも遅れてしまうのではないかといつも焦っているんですけど、実はベーシックなことってあんまり変わってなくて、それを知ってるだけで実際に学者として世界に出てもだいぶ違っているのですね。
先ほど西内さんのお話に付け加えると、とても頭がよくて、数学をわかっているのに、予測と因果推論の違いがわかってない人がいて、そこを勘違いしてしまうと大変なことになってしまいます。予測というのはただ単に、自分は何もしないで将来何が起こるかを予測することです。因果推論というのは、そういう予測があった上で、自分が政策を変えたとか、マーケティング戦略を変えた時に何が起こるかということです。この違いというのは非常に大事で、そういうことを勉強しただけで、ビジネスの世界に進んだ時に大きな間違いを防ぐことができます。
西内:最後に、学生さんや研究者の方、日本の人たちに、これだけは言っておきたいことはありますか?
今井:現在はビックデータの世界とよく言われていますが、それをどうやって分析していくかということの方が課題になっているので、なるべく多くの人にまずデータを分析してもらって、それの重要さや楽しさをわかってもらえればいいなと思います。
それから、企業や組織を指揮する立場にいる方は、データやデータ分析の大切さを若い世代に伝えて、知識や技術を持っている学生たちを重宝してくれればなと思います。
西内:企業がこれからデータ分析に重きを置いていくという事実を端的に示しているデータがあるのですが、データ分析に対してどれぐらい投資して、どれぐらいリターンがあったかをいろいろなケースを集めて分析した結果、そのROIは平均13倍という数字が出ています。1000万円くらいの人件費を払っても、1億3000万円くらい企業に還ってくるという意味です。多分感覚的にはおそらく行政の世界も同じだろうと思います。
これから就職してビジネスの世界に身を置く方は、この話をして上司を説得するとよいのではないでしょうか。会社の中では効果のよくわからないことにお金を使う部分もある中で、データ分析を適切に行なえば、しかるべきところにリソースを振り分けることができるようになる。ビジネスだけではなくて行政の世界でも、ぜひ皆さんもお仕事に関わる範囲でデータ分析を取り入れてください。
今井:それは大学も一緒ですね。教員を採用する時も、そういう技術を持った教員を採用していただければと思います。その教員が学生を育ててその学生たちがまた社会に巣立っていくのでとても大事なことです。
西内:最近は私立大学も受験生を集めるために広告を出稿したりしますが、それをデータ分析できる教授に手伝わせればいいんです。絶対効率化できますから(笑)。今日はありがとうございました。 (終)