スマホを見る人写真はイメージです Photo:PIXTA

日常的に目にする医療機関や健康食品の広告。そこに書かれた「○%」「○割」の数字は、果たしてどれだけ信用できるのだろうか。実はそれらの大げさな数字には、消費者を巧妙にだます仕組みが隠されている可能性もあるのだ。確率や統計の観点から、情報の受け手が適切に数字を読み取る方法を考える。※本稿は、田近亜蘭『その医療情報は本当か』(集英社新書)の一部を抜粋・編集したものです。

「飲酒する人には肺がんが多い」
その説は果たして正しいのか?

 たとえば、「飲酒」と「肺がん」の関連性を考えるとしましょう。「飲酒する人には肺がんが多い」と聞くと、飲酒と肺がんには「因果関係」があると思いがちです。しかし、実はその背後に「喫煙」があり、これが肺がんの発生率に影響を与えている可能性があります。

 2つのことがらのAとBの間で、Aが原因となって、Bという結果が起こる関係を因果関係といいます。日常でよく使われることばですが、医学でそれを証明するにはたいへん難しいのです。情報処理や統計、数学、医学など、特定の情報やデータを扱う分野においては、真にその関係が成立するのかを追究します。

 因果関係には「時間順序」と「直接性」があります。時間順序では、Aが先に起こったことで結果としてBが起こることを指し、直接性ではAがBを直接引き起こしていることをいいます。直接性では、AがBより先に起こっていても、Bがほかの要因で引き起こされている場合、AとBの間に因果関係は成立しません。

 この「ほかの要因」、つまり「第三の因子」のことを「交絡因子」といいます。ことばは日常ではめったに使わないと思いますが、高校『情報Ⅰ』の一部の教科書には太字で掲載されています。

 そして、先述の飲酒量と肺がんの例では、「喫煙」が交絡因子となります。飲酒する人のうち喫煙者が多かった場合、実は飲酒と肺がんに関係があったのではなく、喫煙と肺がんに関係があっただけで、飲酒とは直接の関係はなかったということです。

実際には因果関係はない
「擬似相関」という罠

 また、因果関係の有無とは関係なく、単に「Aが増加するとBも増加する。あるいは減少する」という関係のことを「相関関係」といいます。

 因果関係を立証するには、少なくとも次の3つの規準、「相関関係があること」「時間的順序関係があること」「交絡因子が排除されていること」が必要だと前述の高校の教科書には書かれています。実のところ、医学研究などでの因果関係の証明はかなり複雑です。

 そして、実際には因果関係がないにもかかわらず、交絡因子Cを介して、あたかもそれがあるかのように見えることを「擬似相関(見かけの相関)」といいます。

 統計学などでよく挙げられる擬似相関の例に、次のことがらがあります。

(1)アイスクリームの売り上げが増えると水難事故の数が増える
(2)小学生の身長が高いと算数の点数が高くなる
(3)各国のチョコレートの消費量が増えるとノーベル賞の受賞者数が増える