『週刊ダイヤモンド』4月13日号の第1特集は「数式なしで学べる 統計学超入門」です。世の中にはさまざまな統計データがあふれていますが、政府統計で不正が見つかったように、全てのデータが真実を語っているとは限りません。いまわれわれに必要とされているのはデータを正しく読み解くための「目の付けどころ」を鍛えることです。そのための統計学の超入門編を、教授と学生の会話による講義形式で分かりやすくまとめました。

「平均」といえば、イコール「全体の真ん中」だと思っていませんか?
Photo:PIXTA

 ここはとある大学の研究室。統計学の講義を担当する教授のもとに、学生のマナブくんが質問にやってきました。

(マナブ)この前、60代以上のフリマアプリ利用者の平均資産額が約2500万円で、非利用者より400万円も多かったっていう調査結果をメルカリが発表してましたけど、先生はどう思います?

(教授)この前も教えたように、「平均」は便利な数字だけど注意する必要がある。下の図を使って説明しよう。

 統計学ではデータ全体の特徴や傾向を表す数値を「代表値」と呼ぶ。代表値には三つあって、一番よく使われるのが、全てのデータを足してデータの数で割った「平均値」だね。そのほかに、データを大きさの順に並べたとき真ん中にある値である「中央値」、データの中で最も頻繁に現れる値である「最頻値」があるんだ。

 三つの代表値にはそれぞれ、得手不得手があるから、データの種類によって使い分けた方がいい。

 まず平均値のいいところは、全てのデータを足して割っているので、全体の特徴をつかみやすいこと。ただ、極端なデータがあるとそれに引っ張られて全体が見えにくくなることもある。