データをもらうには、リアル「石の上にも3年」?

西内 最近は総務省統計局だけでなく、独立行政法人統計センターの「オーダーメード集計」でいくつかのデータを取れるようになりましたが、やはり分析する以前に、開示の手間が面倒すぎるんです。そのうえ、先ほどの全国学力・学習状況調査のように手続きを取っても使わせてもらえないデータもありますし。

西内啓(にしうち・ひろむ)東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバード
がん研究センター客員研究員を経て、2014年11月より株式会社データビークルを創業。自身のノウハウを活かしたデータ分析ツールの開発とコンサルティングに従事する。 著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。

中室 文部科学省によると、全国学力・学習状況調査の実施には50億円以上が投じられています(学級規模を40人から35人にしても削減できる費用が86億円にしかすぎないにもかかわらず!)。この調査を有効利用してほしいと思っているのは私だけではないはずです。

西内 全国学力・学習状況調査に限らず、統計法に指定されたデータをもらうのだってスムーズには運びません。まあ、ここまでの話の流れ的に「そりゃそうだろう」という感じですが(笑)。官庁内部の人であっても個票レベルのデータを扱おうとすると膨大な書類を書かないといけない。外部の人なら、なおさらです。しかも、そのデータはエクセルなど一般的なソフトウェアで使うCSV形式にさえなっていない。未だに固定長テキストデータのままなんですよ。左から何桁目までが生年月日のデータが入っている、その次が「0、1」で性別(男性、女性)を表わしている……という。

中室 私のこれまでの経験でも、統計法の手続きに従って、ある統計の個票データ使用の申請をしたとしても、分析できるようになるまでに1年くらいはかかりますね。

西内 さらに言うと、調査してから公表され、アクセス可能になるまでに2年間ぐらいはかかっています。実際の調査から2年、個票申請から1年だとすると、リアルに石の上にも3年、です(笑)。

中室 入手できた頃には、すでに社会・経済の状況が変わっていても不思議ではありませんね。

西内 そんなに時間が掛かっていると、応用経済系の研究者が日本で活躍しようと思っても、かなり束縛されてしまう面がありますよね。優秀な応用経済学者たちが海外にポストを探しに行くのもわかります。最近は政府の政策でも費用対効果の評価が求められてきていますが、政府の統計データ関連をきっちり使いやすく整備するのは、行政の人件費やら学者の研究費やらをめちゃくちゃ削減できる良い投資なんじゃないかと思います(笑)。

データが明らかにした、「女の子は理系に弱い」の真相

中室 私が最近注目している研究があります。ゲーミフィケーション学習教材を提供する「すららネット」(湯野川孝彦社長)の学習ログを、行動経済学者である世界銀行の田中知美氏と計量経済学者の萱場豊先生が分析しておられるのです。田中氏らは「すらら」を利用中のある高校で、1年生446人の冬休みの学習行動を分析し、これまでわかっていなかったことを次々に明らかにしています。

西内 その学習履歴からはどういう結果が得られたのですか?

中室 まず、男子よりも女子の方が学習時間の増加は顕著で、宿題の目標達成率も女子の方が高かったそうです。しかし、女子生徒は意外なことに、締め切り間際になって急に学習時間を延ばし、一気に宿題を終えようとしていることもわかったのです。いわゆる一夜漬けですね。

西内 女の子がコツコツ型だと思われがちですが、そちらのデータからは一夜漬け型が多いというわけですね。学習効果としては、どちらが効果的なのですか?

中室 一夜漬けにあまり効果がないことは様々な研究で明らかになっています。このため、女子は、学習時間に見合ったリターンを得られていないかもしれません。また、女子は理数系科目を不得手とするという研究も多く存在しています。田中氏らの研究は、特に理数系の科目に男女の間で差が生じる原因を明らかにするうえで非常に貴重なエビデンスを提供しているといえるのです。

西内 うーん、それは意外な結果ですね! 従来の男女の勉強イメージとはまったく違います。

中室 おそらく教員の側にも「女子はコツコツ型」「男子は駆け込み型」というイメージが定着しているのではないでしょうか。ひょっとすると、(男子ではなく)女子に対して「毎日コツコツ勉強することが大切だよ」と言葉をかけるだけで、女子の先送り行動は修正されるかもしれません。非常に科学的で、学術的にレベルの高い研究だと思っていますし、こうしたデータを研究者に対して公開し、分析をすすめているすららネットもお見事だなと思っています。