コンピュータは物理世界をそのまま認識することはできない。物理世界の対象の代わりになるのがIDである。IDの割り当てが不適切だと、分析にならないか、非常に手間がかかる。実際、ビッグデータといわれている事例は、ID付けに失敗しているがために、処理が“ビッグ”になっているだけのことが少なくない。
続きを読むビッグデータとID――統計手法や分散処理基盤に頭を悩ます前に知っておくべきこと
会員限定
コンピュータは物理世界をそのまま認識することはできない。物理世界の対象の代わりになるのがIDである。IDの割り当てが不適切だと、分析にならないか、非常に手間がかかる。実際、ビッグデータといわれている事例は、ID付けに失敗しているがために、処理が“ビッグ”になっているだけのことが少なくない。
続きを読む