2013年6月2日付の日本経済新聞において「個人や企業が生み出すデータの量は28億テラ(テラは1兆)バイトを超えた」とあった。続いて「1テラバイトは朝刊1千年分」という喩(たと)えが紹介されていた。
1兆バイトの28億倍の1千年分といわれても、どれだけの量なのか、皆目見当が付かない。それだけの量の朝刊を、誰が読むというのだろう。
本連載では、億円単位や兆円単位の金額が、ぽんぽんと飛び交う。地球から太陽までの距離は「1500億メートルだ」といわれてもピンとこないのに、「1500億円」は何となくわかったような気になってしまうのが不思議だ。
他人のカネを1円から1500億円まで数えても味気ないので、28億テラバイトの起点となる「1バイト」とは何か、を考えてみたい。ただし、1バイトは「8ビット」と定義されるので、1バイトではなく、さらに小さな単位である1ビットの話をしよう。
1ビットを、英数字1文字と考えてしまいそうだが、そうではない。選択肢が2つあった場合、どちらか1つを指示する情報の量を、1ビットいう。例えば、500円硬貨を投げて表か裏かを教えてくれる情報や、試験結果が合格か不合格かを教えてくれる情報が、1ビットになる。
管理会計の問題を
解くことは、1ビット
管理会計の分野では、「2つの投資案件のうち、どちらを選択したほうが有利かを答えなさい」という問題がしばしば登場する。この問題は、実は1ビットなのである。
1時間も2時間も机にしがみつき、電卓をひたすら叩いて、A案とB案どちらの投資案件が有利か、という問題を解くことは、答案用紙に記述された結果だけを見れば「1ビット」にすぎない情報なのである。
1ビットというのが如何に小さな単位であるか。そして、1ビットでさえ、そこに注ぐ労力が如何に大きいものであるかを、まずは理解していただこう。
1ビットを、別の例で説明しよう。例えば平屋のアパートに2室の部屋があって、「右側の部屋を訪ねよ」と指示する情報は1ビットである。
次に、1階と2階それぞれに2室(計4室)の部屋があって、「2階の右側の部屋を訪ねよ」と指示する情報は、2ビットになる。「1階か2階か」で1ビット、「左側か右側か」で1ビット、合わせて2ビットになる勘定だ。
さらに、8個の選択肢から1つを指定する情報は3ビット、16個の選択肢から1つを指定する情報は4ビットになる。ここまで説明すれば、おわかりであろう。「2のa乗」から1つを指定する情報の量が「aビット」になるのだ。
すなわち、ビットの正体は、2という数値の右肩に乗る「指数」であることがわかる。したがって、「2の8乗=256個」から1つを指定する情報(8ビット)を集めて、それがようやく「1バイト」になる。これだけでも大変な情報量を抱えていることがわかる。
ましてや、1兆バイトの28億倍ともなると、人の手に負えない。これをビッグデータと呼び、スーパーコンピュータなどによって解析が行なわれることになる。