2016年の発売直後から大きな話題を呼び、中国・ドイツ・韓国・ブラジル・ロシア・ベトナム・ロシアなど世界各国にも広がった「学び直し本」の圧倒的ロングセラーシリーズ「Big Fat Notebook」の日本版が刊行される。本記事では、全世界700万人が感動した同シリーズの数学編『アメリカの中学生が学んでいる 14歳からの数学』より、本文の一部を抜粋・紹介する。

アメリカの中学生が学んでいる「データ分析」超入門【700万人が感動した数学ノート】Photo: Adobe Stock

代表値

 統計的質問をしたら、次にすべてのデータを集める。

 そのデータのすべての数値をひとまとめにしたものを、データセットという。

 データセットが得られたら、そのデータを記述して分析する。

 データセットを分析するための道具の1つが、代表値である。

 代表値とは、データセットのすべての数値を要約して1つの数で表したもの。

 すべてのデータを列挙するよりも、代表値を示した方が、ずっと簡単に理解できる。

【例】
 
私の成績評価平均値(GPA)は、私の全教科の成績の代表値である。

〔※注:GPAとは各科目の成績から特定の方式によって算出された学生の成績評価値のこと。アメリカの大学・高校などで一般的に使われている〕

 よく使われる代表値が3つある。

 1. 平均値算術平均ともいう)は、データセットから計算される代表値の1つ。平均値を計算するには、すべての数値を足し合わせて、数値の個数で割る。

【例】
 
5つの街区にそれぞれ何棟の建物が建っているかを調べた。
 そのデータセットは、5,10,12,13,15となった。
 平均値は?

 5+10+12+13+15=55 すべての数値を足し合わせた。

 55÷5=11 次に、それを数値の個数(5)で割った。

 平均値は11

 つまり、1つの街区には平均で11棟の建物が建っている。

 ※真っ先に平均値を求めるべきかどうかは、場合による。

アメリカの中学生が学んでいる「データ分析」超入門【700万人が感動した数学ノート】
アメリカの中学生が学んでいる「データ分析」超入門【700万人が感動した数学ノート】
アメリカの中学生が学んでいる「データ分析」超入門【700万人が感動した数学ノート】
アメリカの中学生が学んでいる「データ分析」超入門【700万人が感動した数学ノート】
アメリカの中学生が学んでいる「データ分析」超入門【700万人が感動した数学ノート】
アメリカの中学生が学んでいる「データ分析」超入門【700万人が感動した数学ノート】
アメリカの中学生が学んでいる「データ分析」超入門【700万人が感動した数学ノート】