ベストセラー『統計学が最強の学問である』『統計学が最強の学問である[実践編]』『統計学が最強の学問である[ビジネス編]』の著者・西内啓氏が、識者をゲストに迎えて統計学をテーマに語り合うシリーズ対談企画。今回も教育分野における「エビデンスベースト」の重要性を説き、注目を浴びる気鋭の経済学者・中室牧子氏をゲストに迎え、データの公開を阻む日本の法律の実態、勉強における意外な男女差などをお話しいただきます。(この対談は、2015年に行なわれたものです)

研究者に立ちはだかるデータ公開の壁

中室牧子(なかむろ・まきこ)1998年慶應義塾大学卒業。米ニューヨーク市のコロンビア大学で修士号と博士号を取得(MPA/MPhil/Ph.D.)。専門は、経済学の理論や手法を用いて教育を分析する「教育経済学」。日本銀行や世界銀行での実務経験があり、日本銀行では、調査統計局や金融市場局において実体経済や国際金融の調査・分析に携わった経験をもつほか、世界銀行では,欧州・中央アジア局において労働市場や教育についての経済分析を担当した。

中室 昨年は『統計学が最強の学問である』の大ヒットもあり、ビッグデータという言葉に注目が集まっています。統計リテラシーが上がることは良いことなのですが、「ビッグデータ」と「統計」の違いが十分に理解されていないと感じることがあります。

西内 と、言うと?

中室 ビッグデータというのは、目的があって集めたデータではなく、ある経済活動の結果集まった巨大な業務データです。それに対し、統計は、「分析の目的」に沿って収集されているものです。そして、特に政府が収集する公的統計は、「統計法」によって学術研究への活用の範囲が定められています(参照:「統計法について」)。

例えば、統計法で「統計」に分類されている統計の多くは、一定の手続きを踏めば、個票と呼ばれる調査票情報の提供をうけることができるのです。しかし、問題は、事実上統計なんだけれども、統計法に分類されないようなデータです。例えば学力テストの代表的なデータである「全国学力・学習状況調査」は統計法の「統計」に分類されないので、研究者はこの学力テストの個票データを分析することができないのです。前にご紹介した、慶応大学の赤林教授らの研究は、自治体に対して情報公開請求を行うことで全国学力・学習状況調査のデータを入手しています。しかしこれを全国の自治体に対して行うのは現実的ではありませんので、事実上、全国学力・学習状況調査の利用は極めて限られているといってよいと思います。

西内 「全国学力・学習状況調査」のデータは情報公開請求をかけないと取れないんですか!(笑)

中室 総務省のホームページによると、「統計調査には、意見・意識など、事実に該当しない項目を調査する世論調査などは含まれません」とありますから、全国学力・学習状況調査は「意見・意識など、事実に該当しない項目を調査する世論調査など」ということなのではないでしょうか(笑)。

データを抱え込みたがる日本
公開が原則のアメリカ

中室 全国学力・学習状況調査のデータ公開が限られているせいで、文部科学省所轄の研究機関である国立教育政策研究所に所属する研究者など、限られた人しかそのデータの分析をすることが許されていないのです。

西内 そうなると、都合の悪いデータは出したくないという気持ちが働いても不思議ではありませんね。

中室 はい。最近、佐賀県教育委員会が、タブレット端末の導入が県下の高校生の学力に与える効果を測定した際にも、タブレットを導入してない学校でも学力の上昇が認められていたにもかかわらず、導入校の成績の上昇のデータだけを示し、「タブレットの導入によって学力の向上が認められた」という見解を示したため、大きな問題となりました。自分たちが行った政策の効果を自分たちで検証するとなると、都合の悪い情報は出さないでおこうという誘因が働くのは当然のことですから、それで客観性を担保できるわけがありません。第三者機関による政策評価を徹底する必要があるでしょう。

西内 大昔の、データすなわち情報を握っているほうが優位に立てる、というような政治的ロジックの名残なんですかね。

中室 アメリカでは、たとえ個人に関する情報やデータであったとしても、それは「国民の財産」であると捉えられています。ですから、そのデータを公開し、研究者が分析し、国の政策に生かすことは、国民の利益になるという認識があります。一方、日本では、特に教育分野において、個人情報やセキュリティポリシーに関する考え方が確立しておらず、研究者がアクセスできる情報はかなり限られているのが実情です。

西内 教育分野はまだまだ開拓の余地がありそうですね。

中室 開発途上国の中には、労働力調査や家計調査などの政府統計の個票データをインターネット上で世界中のすべての人に公開しているところもあります。昔世銀に勤務しているときに、同僚のエコノミストにこの理由について尋ねたところ、「データを開示すれば、政府がわざわざエコノミストを雇用しなくても、世界中の優秀なエコノミストがこぞって分析をしてくれるだろう」という答えが返ってきました。なんというクレバーな方法だろう、と思ったものです。研究者は常に「Publish or Perish(出版か、消滅か)」という強いプレッシャーに晒されていますから、情報量が多く、代表性のあるデータであれば、多くの研究者がそのデータを分析して、論文を書きたいと思うでしょう。開発途上国政府は、その研究者の性質をうまく利用しているのです。

西内 他人の知恵を使って、無料でデータ分析をしてもらえるわけですから、アタマがいい方法ですよね。

 最近の動きとしては、特に経済学では論文を投稿するときにデータを付けないと掲載を許可しない、という学術誌も出てきていますよね。ところが、使用したのが統計法で指定されているデータだった場合、「この学術誌に論文を出すので、もらったデータを公開するよ」と言うと「ダメです」と断わられる。意地悪しようというわけではなく、法的な壁のせいなんですが。

中室 統計法で「第三者への開示」というのは禁止されているから、ですね。最近は、西内さんが指摘されたように、データの公開が条件になっている学術誌も増えてきています。再現性が重要なのは、自然科学だけでなく社会科学においても同じです。特定の研究者にしかアクセスできないデータでは、再検証はできず、再現性が確保されているとはいえません。この問題は研究者にとっては死活問題ですね。