ビッグデータという言葉が流行っているからでしょうか。コンピュータサイエンスを専門にしている当方にまで、データ分析の相談がやってきます。さて、その相談で圧倒的に多いのはマーケティングにデータを活用したいというものです。

 ビッグデータのブームに浮かれている方には、残念なお知らせになりますが、データから未知の特性を浮かび上がらせることは困難です。また万能なデータ分析方法はありません。調べたい特性に応じて適切なデータ分析方法を選ばないといけません。

 ですから、実際のデータ分析は、マーケティング向けに限らず、まずは対象となるデータに何らかの特性があると仮説を立てて、その特性を調べるのに向いた分析方法を選んで、その分析から、実際にその特性があるかを確かめるという、仮説検証の繰り返し。そして仮説の多くは間違っているので、試行錯誤となります。だから、データ分析では、その分析をする前に、対象となるデータにどんな特性があるのか予測できるかが勝負となります。

 今回は当方がよく使っている、事前にデータ特性を予測する方法をちょっとだけ御紹介したいと思っています。もったいぶって書いていますが、比較的精度が高いわりに、意外に知られていない方法のように思っています。

自販機はマーケティング情報の宝庫

 一番多い相談は、顧客行動分析ですが、意外に多いのは小売業などが出店先の商圏を調査したいというもの。例えばショッピングモールにテナントを出すことを計画している小売事業者から、テナントを出すフロアーの顧客比率を調べたい。またはオフィス街の店舗などが近隣企業の社員構成などを調べたいというものです。皆さんならばどのようなデータを集めて、どのように分析しますか?

 当方の場合は、その場所や周囲のエリアに設置されている飲料用の自動販売機(以降、自販機)を見て回ります。実際、自販機に並べられた飲料品の種類を見るだけでもいろいろなことがわかります。以降、その一例を紹介しますが、あくまでも指標なので、それを鑑みて読んでください。

 まず商業エリアでもオフィス内でも、自販機にフレイバー系の紅茶やジャスミンティが多目に並んでいる場合は、女性比率が高い、それも比較的若い女性が多いと推定されます。同様に爽○美茶のように美容にいいとうイメージを作っている飲料が多い場合も女性比率は高いことが多いようです。

 炭酸飲料の比率が高い自販機も見かけます。商業エリアの場合、未成年者が少なくないなど、いろいろ見えてきますが、興味深いのはその自販機が職場にある場合。自販機の炭酸飲料の比率はオフィスよりも工場などの、空調が効かない職場では高くなる傾向があります。

 ですから、オフィスなのに妙に炭酸飲料の比率が高い自販機を置いている場合は外回りの営業職が多いなどの別の要因を推測すべきとなります。なお、商品構成は場所に依存します。スポーツ施設にある自販機では炭酸飲料は多くなり、コーヒー飲料は少ない。逆にパーキングエリアや道路沿いの自販機にはコーヒー飲料は多いといわれます。