「ビッグデータやデータサイエンス、AIによる分析は魔法ではない」。マイクロソフトやグーグルでエンジニアとして活躍し、現在は複数の企業で技術顧問を務める及川卓也氏は、そう警鐘を鳴らす。データやツールの基本的な取り扱い方こそが日本のデータ活用のカギになるという及川氏が、真に価値のあるデータとはどういうものかを語る。
「21世紀の石油」ともてはやされたデータ
実はそれほど価値がない?
2010年代は「データの時代」でした。ビッグデータやオープンデータの活用、パーソナルデータの流通・活用に注目が集まり、「データは21世紀の石油」ともてはやされてきました。ところが最近では「実はデータにはそれほどの価値はないのでは」という言葉も耳にするようになっています。ガートナーの「ハイプ・サイクル」で例えれば、「過度な期待」のかかったピーク期を越えて幻滅期に入ったかのようです。
確かに今、量的にはたくさんのデータが収集され、蓄積されるようになっています。私たちがこうしている間にも、世界中の工場や店舗、街、家庭内など、さまざまなところに設置された機器からきめ細かくデータが集められています。身近なところで言えば、電力・ガス・水道といったインフラのスマートメーターなども、そうしたデータ収集を行う機器のひとつです。
しかし、こうして収集されたデータのうち、真に活用できるものはごく限られています。ほとんどのデータがあまり使えないものなのです。
使えないデータがなぜ蓄積されているのか。それは、「誰かがいつか使うかも」と取りあえず収集しているケースが多いからでしょう。ところが、こうして収集されたデータはそのままでは使えず、加工に非常に手間やコストがかかるため、実際には活用されずじまいになるのです。
また、データは内容によっては、持っていることがリスクになるケースもあります。特に個人情報はその最たるものです。プライバシーやセキュリティに理解のない企業ほど、「いつか使うかもしれない」と活用もしない項目を含めて個人情報を収集し、保持し続ける傾向がありますが、これは漏えいなど、大きなリスクをはらんでいます。データは「どう使うか」を意識して、必要なものを必要な状態で保持することが重要なのです。
通信網の発達やクラウドサービスの拡大で、ビッグデータが容易に手に入るようになり、データサイエンスやAIによる分析がもてはやされる傾向もあります。ただし、これらの分析でも「今まで使えなかったデータが魔法のように活用できるようになる」わけではありません。
日本でも、個人の承認を得てデータを管理・提供する「情報銀行」や、データ保有者とデータ活用希望者を仲介する「データ取引市場」のような構想も立ち上がり、実際のサービスも始まりつつあります。ただ、まだ世の中がこうしたデータによって変わったというところまでは至っていないのが現状です。