統計学の解説書ながら42万部超えの異例のロングセラーとなっている『統計学が最強の学問である』。そのメッセージと知見の重要性は、統計学に支えられるAIが広く使われるようになった今、さらに増しています。そしてこのたび、ついに同書をベースにした『マンガ 統計学が最強の学問である』が発売されました。本連載は、その刊行を記念して『統計学が最強の学問である』の本文を公開するものです。第25回では、統計家たちが棲息する主要な6分野のうち、「心理統計学」について解説します。(本記事は2013年に発行された『統計学が最強の学問である』を一部改変し公開しています。)

『統計学が最強の学問である』250Photo: Adobe Stock

 IQすなわち知能指数という言葉は小学生の読む漫画の中にも登場するが、ほとんどの人はこの指標の意味をわかっていないのではないだろうか。

 フィクションの世界における「高いIQを持つキャラクター」の描かれ方は、「頭の切れる天才」であったり、一方で「頭は切れるが性格的な欠陥を持つ人間」であったりする。おそらくこれは現実におけるIQのイメージを反映しているのだろう。アインシュタインのIQはすごく高いらしい、といった話が話題になることもあれば、人間の価値はIQじゃ測れないとか、IQの測定は差別の源であるとかいう言説を耳にすることもある。一昔前にはIQよりもEQ(心の知能指数)が重要だなんていう本が売れたりもした。

 だが、身長や体重、血圧のように物理的に測定できるものと違って、知能というものは見たり触れたりできるものではない。知能とはそもそも何で、いったいどうすれば測れるというのだろうか。そしてなぜ、現在用いられているIQテストのようなもので知能は測定できたというのだろうか。こうしたことを理解せずにIQの高さをありがたがるのも、反対にIQという指標自体を攻撃するのも滑稽なことである。

 IQとは何かを理解しようとすれば、心理学者がこの100年で積み重ねてきた統計手法について学べばいい。それが次のテーマだ。

「一般知能」の発明

 革命的な発明のすごさを理解したければ、試しに自分ならどう作るかという思考実験をしてみるというやり方がある。もしあなたが会社の人事部で新卒採用を担当していたとして、既存の知能テストを用いずに、「知能の高い学生を採用するやり方を考えてくれ」という仕事を割り振られたらどうするだろうか。

 簡単な指示に対する反応速度を測定しようとする人も、文字の羅列を一定時間に何文字記憶できるか測定しようとする人もいるだろう。あるいは単純に算数や国語の抜き打ちテストを出すというやり方もある。実際に、統計学的な裏付けもなく、思いつきでこうしたテストを採用基準に用いている企業も少なくない。

 じつはこうした試みは19世紀の時点ですでにやり尽くされているようで、現在の知能研究の基礎を生み出した心理統計家であるスピアマンの1904年の論文において、「イマイチな先行研究」として紹介されているのだ。

 なぜイマイチか、というと、結局のところこれらは知能を表すだろうという基準を何らかの形で定めて測定してみました、というだけの話にすぎないからだ。「そもそも知能とは何か」という問いには研究者の直感でしか答えていないのである。

 スピアマンは、こうした先行研究で示されていた種々の知能の測定方法をいくつか選び、研究参加者に対して試してみた。そしてそれぞれの「知能を表すはずの指標」の間の相関を分析したのである。

 相関とは「一方の値が大きいときに他方も大きいか/一方の値が小さいときに他方も小さいか」という関連性の強さである。ゴルトンは以前紹介した回帰分析を行なった際に、「直線の当てはまりがよい状態」と、「平均値への回帰が大きく直線の当てはまりが悪い状態」があることを発見した。この違いを相関(Correlation)という言葉で表し、弟子のピアソンが相関係数という指標の計算方法を考えた。完全な直線で「一方の値が大きいときに他方も大きい」場合は1、逆に完全な直線で「一方の値が大きいときに他方は小さい」ときはマイナス1、関連性がまったく見られない場合は0となるような指標である。

 なお、相関とは「一方の値が大きいときに他方も大きい」という傾向を示しているだけで、「一方の値が大きいから他方も大きい」かどうかという因果関係とはまったく別物だということには注意したい。

 そうした研究の結果、スピアマンが発見したのは、異なる知能の側面同士がある程度相関しているという結果である。

 またさらに、それぞれの指標に一定の重みをつけて足し合わせると、すべての指標とよく相関する1個の合成変数が作り出せるということもわかった。

 まったく別々に考案された知能に関わる指標すべてと相関する合成変数が作り出せたのであれば、これこそが潜在的な知能を表しているのではないかと彼は考えた。何せこの変数だけがわかれば、ほとんどの知能に関連したテストの成績が予測できるのである。だとすれば、さまざまな項目を個別に考えるよりも、この潜在的な知能を示す指標だけを扱えばいい。彼はこの指標のことを一般知能と呼んだ(図表38)。

『統計学が最強の学問である』251

知能を7つに分けた多因子知能説

 スピアマンが行なった分析方法は、今では因子分析と呼ばれている。お互いに相関している複数の値から、それらすべてとよく相関する新しい合成変数を生み出すのだ。この合成変数が因子(factor)と呼ばれ、そしてその因子を抽出する分析だから因子分析というわけである。

 因子は「知能」などの抽象的な概念を示すと考えられる値であり、これ自体を直接測定することはできない。しかしながら、因子とよく相関する「測定できるもの」は存在するだろう。たとえば知能であれば、反応速度だとか記憶力だとか計算力だとかいったものは測定できるし、おそらく我々が抽象的に考える知能という因子と無関係ということはないはずだ。

 そして実際に測定されたものすべてと「よく相関する合成変数」が作り出せるのであれば、それはおそらく知りたかった因子をよく推定しているのではないかと、スピアマンや彼に影響を受けた心理学者たちは考えたのである。

 なお、因子は必ずしもスピアマンの一般知能のように「すべての測定項目と相関する1つの因子」だけとは限らない。複数の因子が抽出されることもある。

 実際にスピアマンの研究に影響を受けた心理学者たちがさまざまなテストを組み合わせ、因子分析を行なったところ、一般知能のような形ではなく、複数の因子が抽出されることもしばしばである。

 そうした研究の中で有名なものの1つが、1938年に発表されたサーストンの多因子知能説である。サーストンがさまざまな知能に関わるテストの結果を因子分析した結果、

①空間や立体を知覚する空間的知能
②計算能力についての数的知能
③言葉や文章の意味を理解する言語的知能
④判断や反応の速さに繋がる知覚的知能
⑤論理的推論を行う推理的知能
⑥言葉を速く柔軟に使う流暢性知能
⑦暗記力を示す記憶知能

 といった7つの知性を示す因子が抽出された。

 つまり、たとえば①の空間的知能なら、算数の図形問題やパズル、立体的に配置されたブロックを数えるようなテストの結果についてはほとんどすべての項目とよく相関する一方、文章問題や記憶に関わる問題とはほとんど相関しないような因子、ということである。

 近年の知能研究の中でもこの一般知能か多因子知能かという議論は繰り返されているが、多くの知能検査方法を分析すると、「分野ごとではなく検査項目全体と相関する因子」すなわち一般知能がだいたい全得点の30%~60%ほどの影響力を持つようである。ただし、この一般知能とはいったい何か、という点は未だ明確な答えを出せていない。