『ビッグデータの正体~情報の産業革命が世界のすべてを変える』の共著者であるケネス・クキエ氏が、単なるITキーワードではない、社会全体を変えるエンジンとなるビッグデータ革命の本質を語った。(聞き手/ジャーナリスト 大野和基)
「ビッグデータの3つのV」
には同意しかねる
Kenneth Cukier
2007年~2012年まで、英エコノミスト誌のデータエディターを務める。『ビッグデータの正体~情報の産業革命が世界のすべてを変える』(講談社)の共著者。 Photo by Kazumoto Ohno
――今「ビッグデータ」革命が起きています。しかしながら「ビッグデータ」という言葉が独り歩きしている観もあります。この言葉は、用語としてどれくらい前からあるのでしょうか。
時間を遡ると、随分昔から「ビッグ」と「データ」を並べて使っていますが、それは今日「ビッグデータ」が意味するものではありません。
あるジャーナリストは、時間を遡ってアメリカ政府の報告書の中に「ビッグデータ」という用語が1960年代に使われているのを見つけました。でもそれは今日の意味ではありません。1960年代のビッグデータは今日のビッグデータの足元にも及びません。
2001年にドゥーグ・レイニーというリサーチ・アナリストが、新しいデータのセットとそれが社会でどのように使われているかを述べるのに、「ビッグデータ」という用語を使いました。彼はビッグデータの3つのVを指摘しました。つまりvolume(量)、velocity(速度)、variety(多様さ)です。でも私は賛成しません。Vという文字を3つ使うために、いささかこじつけという感じがします。
今我々が使っている「ビッグデータ」という言葉は、過去に使われていた言葉と違う、まったく新しい概念です。その意味でのビッグデータは2003年ごろから使われ、2005年には定着してきました。
というのもその頃、宇宙学や宇宙物理学、物理学、バイオテクノロジーの分野にいる科学者たちがある問題に直面したのです。
デジタル情報は指数関数的に増えることはわかっていても、それが大きな組織にとって何を意味するか、気づいていません。
一般消費者にとっては、2、3年ごとに容量が倍の新しい携帯電話を買うことはどうということではありませんが、もしあなたがバイオテクノロジーのラボを運営してればどうでしょうか。
1年で容量が倍になり、2年で4倍になるという事態は、あまりにも膨大な情報量になります。データの量がメモリーとそれに対応するツールを超えてしまったのです。そこで、その膨大なデータを分析するインフラとツールの必要性に突き当たりました。
これはソフトウェア、ハードウェア、方法のすべてを刷新する必要があります。そこで「ビッグデータ」という用語を使ったのです。
このスタートラインから、グーグルは「MapReduce」を作り出しました。おそらく日々ペタバイトという膨大な量の情報を扱うためのテクニカルな手段です。「Hadoop」というオープンソースのバージョンもできました。これは今まで処理できなかった新しい方法でデータを処理できることを意味します。
今、一般に使われてるビッグデータという言葉は、やや広い意味を指します。つまり今までデータを使っていなかった分野でもデータを使う可能性を示唆しています。