ビジネス現場にはビッグデータがごく当然のものとして入り込んできている。
今、本当に求められているのは、高度な技能では必ずしもない。プロや専門部署、部下に的確に依頼・指示し、その結果を自分なりにそしゃくし説明できる、統計分析のリテラシーだ。
まずは、すぐに使える統計の基礎をお教えしよう。代表値には、「平均値」「中央値」「最頻値」などがある。このうち、ビジネスデータで特に大事なのはズバリ、マイナーな「中央値」。順に並べ替えて真ん中に来る値だ。
典型的な正規分布では、平均値、中央値などはほぼ同じくらい。それに対して、『図6 対数正規分布の実例「所得」』のグラフのように平均値(529万)と中央値(415万)が大きく食い違うことがままある。二つを比較し、分布の偏りをつかむことで、一歩先に進むことができる。
「分散」「標準偏差」なども頻出する言葉だ。ここで問題になるのが数式や記号への過度なコンプレックス。「Σ(シグマ)」が出てくると青ざめる人が少なくないが、ざっくりとイメージをつかむのが大事だ。Σとは「合計」で、「N分の1Σ」といったら、合計して個数で割る“割り勘”と同じことだよ、と理解すればいい。
「何を?」(中身)に当たるのはx-μ、要は平均からのズレだ。この差がマイナスになる面倒を消すために2乗し、ルート(平方根)で元に戻すという段取りを踏む。