官公庁のオープンデータの価値は
他省庁での活用事例で証明できる
2016年12月の官民データ活用推進基本法公布・施行や、2017年5月の改正個人情報保護法全面施行など、法律の整備が進み、「データを自社のみで抱えず、外部でも活用しよう」という動きは広がっています。前述した情報銀行やデータ取引市場のような構想も含め、さまざまなデータを積極的に活用して価値を生み出そうという「データエコノミー」が新しいエコシステムとして立ち上がろうとしています。
日本の政府が推進する「オープンデータ」にかかわる施策も、こうした官民のデータ活用を促そうという動きのひとつです。このオープンデータの取り組みは、各省庁や地方自治体、公共団体、公益企業などが保有するデータの公開と再利用の促進に向けた施策で、特に東日本大震災後にかなり推進されました。
公共データの公開・再利用を前提とし、二次利用を積極的に推進するというオープンデータ施策。では、そのデータはどのくらい活用されているのでしょうか。実は、公開されるデータ自体は増えているのですが、活用事例はデータ量からするとそれほど多くないのが現状です。
ここでも冒頭で述べた「データさえあれば誰でも使うのか」という問題が横たわっています。オープンデータについても、やはり使えるデータを用意して提供する必要があります。オープンデータが外部でも活用されるような内容かどうかを知るには、まずそのデータが内部で活用できているかどうかがバロメーターとなります。
省庁内はもちろん、ある省庁のデータを別の省庁で参照して加工し、新たな付加価値を付けて政策立案に使われるような事例がたくさんあるなら、そのデータには価値があることが証明されていることになります。実際には縦割り組織の弊害で、同じデータを重複して打ち直すようなことがあるとも聞いていますが、自分たちが互いのデータを活用していることで価値を証明できれば、外部での活用も広がっていくのではないでしょうか。
オープンデータ活用のためには、データの形式が統一されている必要があります。変換しなければ使えないのでは、余計な加工などの手間が生じてしまうからです。そこで2017年5月に内閣官房IT総合戦略本部がまとめた「オープンデータ基本指針」では、公開するデータは「機械判読に適した構造及びデータ形式で掲載すること」を原則としています。
和暦・西暦などの日付や12時間制・24時間制などの時間、漢字などの文字コードから省庁独自の情報まで、二次利用を前提としてデータ形式を統一するためのガイドラインはすでにできています。そして、この基準を使って、省庁ではデータ表記の統一ができつつあります。これまでのようにクローズドでデータを使うという意識ではなく、垣根を越えて外部でもきちんと活用できるように、データを整備していくことが大切だと思います。