統計学の解説書ながら42万部超えの異例のロングセラーとなっている『統計学が最強の学問である』。そのメッセージと知見の重要性は、統計学に支えられるAIが広く使われるようになった今、さらに増しています。そしてこのたび、ついに同書をベースにした『マンガ 統計学が最強の学問である』が発売されました。本連載は、その刊行を記念して『統計学が最強の学問である』の本文を公開するものです。第8回では、データ分析への認識がナイチンゲールの時代で止まっている人や組織への対処法を紹介します。(本記事は2013年に発行された『統計学が最強の学問である』を一部改変し公開しています。)

『統計学が最強の学問である』8Photo: Adobe Stock

「ふ~ん」としか言えないグラフ

 データ分析において重要なのは、「果たしてその解析はかけたコスト以上の利益を自社にもたらすような判断につながるのだろうか?」という視点だ。

 顧客の性別や年代、居住地域の構成を見ると何%ずつでした、あるいはアンケートの回答結果を見ると「とてもそう思う」と答えた人が何%いました、といったデータの集計を「解析結果」として示されることはしばしばある。コンサルタントだとかマーケターだとか名乗る人々の中にも、適当なアンケートをとってキレイな集計グラフを作ることのみを生業にしているんじゃないかという人すらいる。

 だが、果たしてこれらの結果に「何となく現状を把握した気になる」という以上の意味はあるだろうか? その結果を報告したあなたの上司やクライアントは、「ふ~ん」と言う以上に何かリアクションのしようがあるだろうか?

データをビジネスに使うための「3つの問い」

「ふ~ん」以上のリアクションをするとは、すなわち、「ビジネスにおける具体的な行動に繋がる」ということである。そしてそうした具体的な行動を引き出すためには、少なくとも以下の「3つの問い」に対して答えられなければいけない。

【問1】何かの要因が変化すれば利益は向上するのか?
【問2】そうした変化を起こすような行動は実際に可能なのか?
【問3】変化を起こす行動が可能だとしてその利益はコストを上回るのか?

 この3つの問いに答えられた時点ではじめて「行動を起こすことで利益を向上させる」という見通しが立つのであり、そうでなければわざわざ統計解析に従って新たなアクションを取ろうとする意味はない。

 たとえば、素敵なコンサルタントやマーケターから、よく図表9のような「ブランディング調査」の結果を示す美しいグラフが提示されることがあるが、ここから果たして「3つの問い」に答えることができるだろうか?

『統計学が最強の学問である』82

 自社のブランドについて好ましいと思われていようが思われていまいが、ビジネスにおいて重要なのは「ブランドの好感度の高い人ほど購買金額が多いのだろうか?」という点である。逆に、嫌われていようが何だろうが、長期的な売上が変わらないのであれば別にそれはそれで問題ないと考えてもいい。憎まれっ子として堂々と世にはばかるという経営的な判断があってもいいはずだ。

 さらには、「では実際に何らかの行動(たとえばキャンペーンの実施など)によって好感度を上げることができるのだろうか?」という点と、「そのためにどれくらいのコストをかければ、どれだけの利益に繋がるのだろうか?」という点も考える必要があるだろう。

 どうやってもブランドの好感度が上げらないのであれば、やはり粛々と嫌われておくほかないし、好感度によって売上が上がったとしても、そのためのコストによって赤字になるのであればやはり粛々と嫌われておいたほうがマシだ。

 残念なことに、それらの問いに対して何ひとつこのグラフは答えていないのである。

 あるいは、あなたの会社のデータベースにたまった「ビッグな」顧客データから図表10のような集計が得られたとしたらどうだろうか?

『統計学が最強の学問である』83

 こちらについては売上が直接示されているだけ多少マシだが、残念なことに私たちは今存在している顧客の性別を変えたり年齢を急に老いさせたり若返らせたりする魔法を使うことができない。

 できることと言えば、比較的単価の高い性・年代の顧客層を狙ったキャンペーンを打つことぐらいだが、それにしても、

【問2】そうした変化を起こすような行動は実際に可能なのか? 
【問3】変化を起こす行動が可能だとしてその利益はコストを上回るのか?

に対する答えというには貧弱な情報である。

 もし仮にあなたが行なおうとしている、あるいは誰かに依頼しようとしている分析が、そもそもまったく【問1】~【問3】の質問に答えられるものでないのだとすれば、精度がどうとかスピードがどうとか言う以前にそもそもやるだけムダである。おそらく実際出したところで「何となくわかった気になる」という以上の価値はないのだ。

 仕事で出会うビジネスパーソンたちから、「結局のところデータ分析なんかでビジネスは推し量れない」といった意見をいただくこともしばしばあるのだが、このような「何の問いにも答えていない単純集計だけでは推し量れない」というのであれば、全面的に賛成である。結局のところ彼らは、「ビジネスを推し量れないデータ分析しかできない人たち」としか出会ってこなかったのだ。

「集計」だけでよかったのは19世紀まで

 平均を出したりパーセンテージを計算したり、といった古典的な「統計」は19世紀初頭から世界各国で取られている。たとえば看護婦として有名なナイチンゲールがあげた最も大きな業績の1つは、戦争に従軍した兵士の死因を集計した結果、戦闘で負った傷自体で亡くなる兵士よりも、負傷後に何らかの菌に感染したせいで死亡する兵士のほうが圧倒的に多いことを明らかにしたことだったそうだ。

 彼女はこのデータをもとに「戦争で兵士ひいては国民の命を失いたくなければ、清潔な病院を戦場に整備しろ」と軍のお偉方や政治家に迫ったそうだが、これもそうした「集計」の力の1つだったのかもしれない。

 だが統計学は、ナイチンゲールの時代から100年ほどで急激に進化を遂げた。ナイチンゲールの集計グラフは、死亡原因の大きさ自体は明らかにできたかもしれないが、本当に清潔な病院を整備すれば戦死者を減らせるのか、そして病院の整備にどれだけのコストをかければどれだけの命が救われるのか、といった点については、先ほど例にあげたグラフと同様何も答えていない。

 こうした問いに答えようとすれば、20世紀に発達した現代的な統計学の手法を使わなければならないのだ

 ビッグデータ技術を使って全数データを使った単純集計しかしないというのは、最新の技術を2世紀前の手法でしか活用できていないということである。これはまるで、最新のスマートホンを金づち代わりにして犬小屋を作ろうとするようなものではないだろうか。