ダイヤモンド社のビジネス情報サイト
佐藤一郎のパースペクティブ

ビッグデータと国勢調査――その意外な結びつきの話

佐藤一郎 [国立情報学研究所・教授]
【第7回】 2013年7月2日
著者・コラム紹介バックナンバー
1
nextpage

世界最古のビッグデータは、19世紀米国の国勢調査

 アベノミクスの成長戦略の柱として「ビッグデータ活用の推進」が盛り込まれました。今回はビッグデータについて考えてみます。

 ビッグデータの定義が、手持ちのITシステムで扱いきれないほど大量で多様なデータを指すのであれば、世界で一番古いビッグデータの事例の一つは19世紀末の米国の国勢調査でしょう。米国の国勢調査は、日本を含めて多くの国の国勢調査の原型であり、民主主義の最重要基礎データ、つまり有権者数を調べるための手段であり、米国では憲法で10年ごとの国勢調査を行うことが定められています。

 さて、1880年の米国の国勢調査では、集めた調査票の集計に7年以上かかったとされています(集計期間は文献により違いがあります)。当時の米国の人口は7000万人以下であり、仮に一人の国勢調査票のデータが100文字分100バイトだったとして、全データ容量は7ギガバイト。今考えると少ないデータ量といえますが、当時は手に余るデータ量であり、まさにビッグデータだったのでしょう。

 実は米国の国勢調査はビッグデータだけでなく、ITの誕生においても大きな意味を持ちます。当時の米国は移民が増えており、1890年の国勢調査では、人口増から集計に10年以上かかることが予測されました。つまり次の国勢調査までに集計が終わらないことになります。

 そこで米国政府は集計を速くする方法を公募し、そこで採用されたのがハーマン・ホレリス氏が発明したパンチカードによる集計機(タビュレーティングマシン、日本ではパンチカードマシンと呼ばれることも多い)でした。そのタビュレーティングマシンを使うことにより、集計作業は18ヵ月ほどで終わったとされます。

 これはパンチカードと呼ばれる細長い紙に穴を開けることで、1枚のカードで80文字までのデータを表せるようにして、機械でそのカードの穴を読み取り、データ内容によってカードを振り分けます。

1
nextpage
スペシャル・インフォメーションPR
IT&ビジネス
関連記事
クチコミ・コメント
facebookもチェック

佐藤一郎[国立情報学研究所・教授]

国立情報学研究所アーキテクチャ科学系教授。1991年慶応義塾大学理工学部電気工学科卒業。1996年同大学大学院理工学研究科計算機科学専攻後期博士課程修了。博士(工学)。1996年お茶の水女子大学理学部情報学科助手、1998年同大助教授、2001年国立情報学研究所助教授、を経て、2006年から現職。また、総合研究大学院大学複合科学研究科情報学専攻教授を兼任。
専門は分散システム、プログラミング言語、ネットワーク。


佐藤一郎のパースペクティブ

分散システムの研究を核としつつ、ユビキタス、ID、クラウド、ビッグデータといった進行形のテーマに対しても、国内外で精力的に発言を行っている気鋭のコンピュータ・サイエンス研究者が、社会、経済、テクノロジーの気になる動向について、日々の思索を綴る。

「佐藤一郎のパースペクティブ」

⇒バックナンバー一覧