アンドリュー・
ホワイト
ガートナー リサーチ バイス・プレジデント

 先日、訪ねた顧客はデータレイク(ビッグデータを統合して管理する構想の1つ)についてディスカッションしたがっていた。というのは、筆者が訪ねた際は不在にしていたある人物が、自分たちの抱えている課題はデータレイクの概念で解決できると主張していたのだ。話を進める前に、筆者の「率直な」見解を最初に述べさせてもらいたい。

 同僚のニック・ヒューデッカーと私は7月下旬に、データレイクに関する記事を書いた。その記事では、「ベンダーはデータレイクの宣伝を派手に行っている。しかし抽出したデータの再利用が継続的に役立っている実例(またはテクノロジー)は見られない」と述べた。データレイクの中で行われるデータマイニング(データを解析し、有用なパターンやルールを見いだすこと)に価値があるのは言うまでもない。

 ただし、洞察や価値をもたらしてきた知見や枠組みそのものがデータレイクの中にあると思い込んではいけない。それらはデータレイクの内部には存在しない。業界の言葉で表現するなら「情報のガバナンスなくして持続的、または再現性のある価値は生まれない」のだ。的確なアドバイスではないだろうか。

 ところが、そう思わない人もいる。米国の技術情報誌InfoWorldに掲載された「戦略的なソフトウエア開発者」を名乗る人物による「レビュー」を、別の同僚が見せてくれたのだ。

 タイトルは、“Gartner gets the ‘data lake’ concept all wrong”だ。それによると、私たちはデータレイクが役に立たず、企業全体で何やら大規模かつ包括的なガバナンスに取り組むべきだと言ったらしい。また、ある特定企業の技術の押し売りもやったらしい。私たちはどちらの見解も支持しないので反論の必要すら感じない(論旨がそれているし、どちらのケースでもデータレイクだけでは不十分である)。

 もしこのレビューが、私たちの主張の根幹に関するものだったら反論するのだが。実際にデータの解析後に痕跡を残さない場合、どうやって次の人は幸先良く仕事をスタートできるのだろうか。自分が味わった苦労を避けられると言うのだろうか?いずれにしろデータレイクの過剰な売り込みはとどまるところを知らない。