流通ビッグデータ活用の課題と
解決へのアプローチ

――これまでできなかったことができるようになったわけですが、流通業ならではのビッグデータの特性、あるいは注意点などはありますか。

 ビッグデータには「深さと間口」があります。深さは量、間口は多様性と言い換えてもいいでしょう。流通業の特性は深さもさることながら、間口が非常に広いことです。基礎となるPOSデータがチャネルごとに蓄積されており、一方には顧客の属性情報があります。最近はポイントカードなども普及しているので、より詳しい情報を取得できるようになりました。

 例えば、Aさんの情報から、「どのチャネルで、いつ、何を買ったか」がわかる。あわせて、支払い形態や購入商品の組み合わせなども把握できます。

 こうした広い間口と深さとの掛け算で、ビッグデータ分析が行われることも多い。例えば、時間帯ごとの売上と顧客属性を掛け合わせると、「この時間帯は女性の顧客が多い」「この時間帯は勤め帰りの顧客が多い」など、現状を正しく“ストーリー化”できます。同様に、チャネルやエリアごとに、さまざまな切り口で分析が行われます。

 一般に、データベースは深さへの対処は得意ですが、間口が広がると処理速度が遅くなります。多様な種類のデータを掛け合わせて分析するには不向きなのです。ここに大きな課題があります。なぜなら、流通業において求められるスピードがどんどん速くなっているからです。

 例えば、レシート広告に「次回、同じビールを買うと5%オフ」と表示されることがあります。しかし、買物客は次にいつ買いに来るのかわかりません。その顧客の購買履歴などを参照して、「この人は、こんな商品に反応してくれるはず」とわかれば、その場で買える別の商品をお勧めすることができるはずです。顧客がレジ前にいる時間はわずかなので、それには相当の分析スピードが要求されます。

 また、情報を入手するまでのリードタイムという側面もあります。例えば、一般に公開されている地域ごとの消費支出と自社の売上データとの比較分析をする場合、通常はデータベース設計やプログラム開発などが必要です。そのために数カ月かかるケースも多く、「見たい情報をすぐに見られる」という状態にはなっていませんでした。

 こうした課題の解決に向けて日立が提供しているのが「日立流通分析ソリューション」です。広い間口と深さを持つ流通ビッグデータを、多様な切り口で素早く分析できるこのソリューションの大きな特長は、分析軸を変更するときに必要とされる中間ファイル、いわゆるデータマートの作成が不要なことです。プログラミングなどの手間を省けるので、見たい情報をすぐに見ることができます。

 データベースそのものも強力です。2013年に開発した高速データアクセス基盤「Hitachi Advanced Data Binder(HADB)プラットフォーム」は、東京大学生産技術研究所と共同で研究開発を進めている超高速データベースエンジンを日立が製品化したもので、間口と深さの掛け算を非常に得意としています。流通ビッグデータ時代に相応しい高速データアクセス基盤だと自負しています。