バラつきと相関を
見る点グラフ

 代表的な点グラフとして散布図(図2‐5参照)があります。散布図は、データのバラつきの様子を具体的に観察するためのグラフです。統計学的な分析を始める前に、まずは散布図を描いてみることが重要なステップです。データの分布やバラつきから何が読み取れるか。その状態の視覚化が社会現象などへの認識を深めるための手段になります。

 また、散布図の中で、二つの変数の相関を確認するために描かれるものが相関図(図2‐6参照)です。相関というのは、複数の指標値が相互に規則的に関連して変化しているという状態で、その関連の度合いを相関度といいます。

 ある変数と他の変数との関連性を説明する数式を導き出し、そこから得られる理論値を基にデータを分析する統計的分析手法を「回帰分析」といいます。そして、複数の変数間の相関を表す数式を「回帰方程式」と呼びます。

 方程式といっても、そんなに難しいものではありません。中学1年生のときに習った1次方程式を思い出してください。y=ax+bという単純な式です。グラフにすれば直線になります。

 この理論上の関係性を示す直線を回帰直線といい、相関度を調べるということは、この“理論値”に対し、実際のデータがどの程度バラついているかを見ることです。このバラつき度を示す代表的な指標としては「相関係数(R値)」や「R2(R2乗値)」があります。R2乗値は0~1の範囲で表現され、0で無相関、1で完全相関(バラつきなし)を表します。

 目安としては、R2乗値が0.5以上なら「かなりの相関」、0.1未満なら「相関はあまりなし」、その間なら「弱い相関」といえるでしょう。例として提示した「平均寿命と国の豊かさ」のR2乗値は0.66313で、やや強い相関が認められます。