前回は、アナリティクスが可能にした最先端のサービス事例を紹介した。第2回の今回は、アナリティクスを実践するために押さえるべきポイントを紹介する。やみくもに実践しようとするのではなく、「基本的なことを正しく行い、多くのリターンが得られる分野を選択」して初めて、効率的なアナリティクスが行えるという。日本を代表するデータ・サイエンティストがお送りするアナリティクス連載、第2回。
 

 前回紹介したディズニー・ワールドも、あるいはNY市のような自治体も、アナリティクスを積極活用している背景には、みずからが扱うデータについて深い理解があるからこそ活用できているのではないだろうか。そうした理解がなければ、たとえアナリティクスを実践したところで、正しい成果は得られないだろう。確実に成果を得るために欠かせない3つのポイントを、以下に紹介する。

第1のポイント:目的と対象を明確に設定せよ

 実践的アナリティクスでは、限られたヒト・モノ・カネ、さらに時間といった資源を、いかに効率的に使うかが業界を問わず命題となっている。資源配分の効率という問題に対しては、以下に紹介する言葉にヒントが隠されている。

 「20%の努力で80%の正確性を得る」。これは、2012年の米国大統領選挙において全米50州すべての選挙結果を的中させて話題になったネイト・シルバー氏の近著“The Signal and the Noise: Why So Many Predictions Fail-but Some Don’t” (邦訳『シグナル&ノイズ 天才データアナリストの「予測学」』、日経BP社、2013年) に書かれている一文である。
 シルバー氏はこの著書の中で「予測のパレート曲線」という予測に関する学習曲線を提示し、「基本的なことを正しく行い、多くのリターンが得られる分野を選択」すれば、20%の努力を費やすことで80%の正確性を手に入れることができるとしている(編集部注:元となった「パレート効率性」は経済学者のヴィルフレド・パレートが提唱した、資源配分に関する概念のひとつ) 。ちなみに80%の先は、指数関数的に投下する費用に対して、得られる便益が激減していくことについても述べており、このバランスを見据えた意思決定をすることが求められる、とも語っている。

 では、いかにしてこの重要とされる「20%」に企業や自治体は力を集中することができるのか? データ活用の面で考えると、当然、達成したい目的やサービスとその対象を明確にすることから始め、ボリュームゾーンや後々のスケールアウト(横展開)の可能性を検討すべきだ。
 具体的には他のビジネス目的との因果関係をデータから明らかにし、一つのアクションをとることで後に関連した分野でプラスの影響が見込めるかを判定するなどといったことが考えられる。ライフサイクルが容易に予測しやすい携帯電話やパソコン周辺機器などのオプション品の在庫予測などがこれに該当するが、一方でイベント(気象、周辺の公営施設のイベントの有無等)に強く影響を受けてしまう商材(例:加工生鮮食品等)は、予測自体の難易度が高く、投下する工数の割に、精度をあげることが難しい。どちらかというと、リアルタイムに数量を見極め、アラートをあげるパターン認識のような判定処理が向いていることが経験上分かってきている。