「ある企業に勤務する社員の年収を調査したデータがあります。あなたならここからどういう分析をしますか?」
講師が受講生たちに問いかける。この「データ分析基礎講座」を主催しているのは統計ソフトの開発・販売やデータ分析サービスなどを手がけるエスミ(東京都中野区)。統計解析の普及を目的に、25年にわたってセミナーを開催しており、これまでの受講生は累計8627人に及ぶ。1日がかりの有料セミナーのほか、毎月1回、土曜日の午後に2時間の無料セミナーも開催している。
拡大画像表示
「統計の世界で最も有名で使用頻度の高い手法として平均値があります。でも、分析はそれで終わりにはなりません……」と講師を務めるエスミの福島隆司さんが説明する。
バラつきのあるデータの場合、平均値を利用することでデータの概要(中心傾向)が把握できるが、平均値だけでなく中央値や最頻値なども見たり、標準偏差でバラつきの度合いを調べたりすることで、視点は増える。そしてさまざまな視点を持つことで「年収が高い社員と低い社員の違いは何か」といった要因分析につながるのである。
また、例えばアンケートデータの分析では、比較の基準を定めておくことは不可欠だ。「数値の評価を定めずに分析を進めると、数値がよいのか悪いのか判断ができず、結果を見ても『そうなんだ……』という単なる現状認識で終わり、その後の具体的な行動に結び付かない」(福島さん)。