できるだけデータをオープンにしていきたい

西内啓(にしうち・ひろむ) 東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2014年11月より株式会社データビークルを創業。自身のノウハウを活かしたデータ分析ツールの開発とコンサルティングに従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。

西内 あまりにもe-Statを活用しているがゆえに、ちょっと要望もあるんですが……。

須江 どんどんおっしゃってください(笑)。

西内 e-Statって統計局のデータだけでなく、厚生労働省や経済産業省など、さまざまな省庁のデータが入っていますよね。だからカテゴリの切り方が調査によって違うことがあるんです。例えば事業規模を従業員数で分けるときに、この集計表では1人〜30人、30人〜150人……と分けているのに、もう一つの集計表は1人〜15人、15人〜100人という分け方をしている。おそらくこの集計表同士を合わせたら、おもしろい推計ができるだろうなと思っても、少し工夫した処理をしないといけないんですよね。カテゴリを統一するか、統計表にする前のデータを使うことができればもっとスムーズに分析できるのにな、と。

須江 そうですよね。電子化が進み、本格的に分析したいという人も増えているので、統計データとしてそのまま使いたい、表の並べ替えをしたい、などのニーズにも対応していければと思っています。基本的に統計データには個人情報は含まれないので、統計局としては、基礎的なデータはすべてオープンにしていきたいと考えています。

西内 おお、すばらしいですね!

須江 そうでないと、社会としての合理的な判断のサポートが十分できないからです。「小学校のクラスの人数を何人にするか」などの社会の諸問題についても、判断する際の基本はやはりデータです。

西内 この連載に出ていただいた、中室先生も指摘されていた問題ですね。

須江 統計局としては、統計データはできるかぎりオープンにして、市民の皆さんが判断すればいいと考えています。いまは統計に詳しい、それこそ西内先生のような方々も増えてきている。このデータからはこれがわかるとみんなで知恵を出し合い、それが付加価値を生む時代になっています。せっかく税金をかけて調査したデータです。国民の皆さんにオープンにするのは当然だと思います。

西内 そうですよね、調査には何十億円もかかりますから、活用しないと損ですね。

須江 学術研究や経済研究にもっとデータを活用していただくために、総務省の統計部門ではミクロデータを匿名化処理して提供する匿名データの作成・提供や、委託に応じて統計などを作成するオーダーメード集計もおこなっています。また、もっと統計データを身近に感じていただくために、「アプリDe統計」というスマホアプリもリリースしました。スマートフォンのGPSとデータを連動させて、今いる市町村の主要な指標や観光情報などを表示してくれるんですよ。

西内 出張先などで起動したらおもしろそうですね。こういった取り組みがあまり知られていないのは、本当にもったいないことです。

須江 統計は、使ってもらってはじめて価値を発揮するものです。もっと統計を利活用してもらえるよう、統計行政そのものにも今後もイノベーションを起こしていきたいと思っています。