統計的なインサイトを見つけるクラウドソーシングとは

西内 そういう風にとにかく予測モデルを最適化することを重視する、予測型のデータサイエンティストに比べると、洞察型のデータサイエンティストって少ないんだよね。ビッグデータを使っても、短期間で洞察型の新しい発見を得るのが誰にでもできることじゃないからかも。でも、A/Bテストをする領域を絞り込むために洞察を使うのは有効だと思う。例えば、以前Yahoo!がさんざんA/Bテストをやって、検索窓をちょっと大きくしたじゃない。

物理学者から見た統計学<br />――北川拓也×西内啓【後篇】北川拓也(きたがわ・たくや)
1985年生まれ。灘中学校、灘高等学校を卒業後、現役でハーバード大学に合格。数学、物理学科を専攻し、ダブルメジャーで最優等の成績で卒業。その後ハーバードの大学院に進み、2013年、博士過程を修了。今までに15本以上の論文が科学雑誌(Science, Nature Communicationsなど)に取り上げられ、そのうちの3つの論文が編集長に特別重要とされる論文として指定された。世界中の物理学者と共同研究をし、これまで20以上の研究所や国際学会で招待講演をしている。現在、楽天株式会社執行役員としてビヘイビアインサイトストラテジー室室長を務める。

北川 ありましたね。

西内 そのニュースが出る少し前に別のウェブサイトを分析していたんだ。そうしたら、1人あたりの売上に明らかに関係するのが、その人の検索窓の利用回数だということがわかった。つまり、よく検索する人ほど、よく購入している。逆に商品詳細や特設ページは、見た人ほど売上が下がる傾向があった(笑)。

北川 買う気がないけど、時間がある人が見てるんでしょうか。

西内 こういう結果がわかれば、売上を上げるには検索窓を変えるという問題設定ができるよね。大きさや色など変化のさせ方はいろいろあるけど、サイト全体を改変するよりはだいぶ絞り込める。だから統計学的な洞察を使って問題点を絞り込み、最適化していくというのがいいんじゃないかと。

北川 そうですね。最近、僕のデータサイエンスのチームでも、予測と洞察をどれくらいのコンビネーションで使うかを考えています。やっぱり洞察は時間がかかるし、予測のほうが早く効果が出ることも多いですから。そのなかで考えていたのは、統計のクラウドソーシング(※)ができないか、ということです。
※ インターネットを利用して不特定多数の人に業務を発注したり、受注者の募集を行ったりすること。そのような受発注ができるウェブサービス自体を指すこともある

西内統計のクラウドソーシング?

北川 いま、ウェブ上にプラットフォームができて、デザインとかのクラウドソーシングはできるようになったじゃないですか。そういう感じで、統計解析のクラウドソーシングをするんです。例えば、日本の高校2年生で、数学が好きかどうかを縦軸、数学の成績を横軸にとってグラフ化したら、だいたい好きな子は成績もよく、嫌いな子は成績が悪いっていう結果が出ると思うんです。でも、そのなかに数学の成績が良くないけど、数学がめっちゃ好きな子というのが数人いたとします。こういうポジティブディビアンス(良い逸脱者)に対する、インサイト(洞察)を見つける作業などを、クラウドソースするんです。

西内 ああ、なるほど。なぜそういう子がいるのか、ネット上で問いを投げかけて考えてもらうんだ。おもしろい発見をする人はいそうだね。

北川 そこからどういう有用な洞察を得るかって、センスによりますよね。データサイエンティストじゃなくてもそういうセンスがいい人って、絶対いると思うんですよ。というのも僕、アップル社の製品のデザインをやっていたフロッグデザインの人と話して疑問を感じたんです。彼らはデザインをするときに中国やインドなど、その製品が使われる地域に足を運んで、自分たちでインサイトを見つける。でも、「この人たちってインド人の気持ちが本当にわかるのかな?」と思って。

西内 ははは(笑)。

北川 無理にわかろうとするくらいなら、インド人にインサイトを見つけさせたほうがいいじゃないですか。

西内あー、それはたぶんそうしたほうがいいだろうね。難点があるとしたら、クラウドソーシングのプラットフォームに集まっている人が、その時点で結構バイアスがかかっているということ(笑)。そのバイアスと相性が悪いテーマだと、いいインサイトが見つからないかもね。

北川ああ、それはあるかもしれない。