アナリティクス/データサイエンティストに対する期待
メモリやCPU性能、ストレージなど、並列処理技術のITの飛躍的向上には目を見張るものがある。それを活用してサービス供給側は何をすべきなのか? 実際、アナリティクスのサービス市場自体の形成は未だ発展途上でITの進化に追いついていない。アナリティクスをサービスする筆者の立場からすると、このキャッチアップのニーズは大きなビジネスチャンスになりつつあると考えている。
最近米ハーバード・ビジネス・レビュー誌が「データサイエンティストは最もセクシーな職業」と題した記事を掲載していた(2012年10月号)。ここで言われているのは、何も文言どおり頭脳明晰さをセクシーと表現しているわけではなく、極めてユニークで希有、有望な「熱い」市場(専門領域)という意味である。
ITベンダーもこの動きに注目している。筆者の所属するアクセンチュアと戦略的アライアンスを組んでいて、筆者自身が米国本社の外部顧問を務めるSAS Instituteが、これまで得意としていた統計の領域から、市場の大規模データ処理基盤に対するニーズを捕捉して、High Performance Analyticsなどの製品を掲げ、アナリティクスで全方位的な戦略にでている。同様に面的戦略でアナリティクス市場にコミットするのが、ストレージでトップベンダーであるEMCだ。両社はお互いに相互排他的な製品を組み合わせたアプライアンスを掲げるなど、協業体制も組んでいて、攻めるべき方向性を的確に理解し、お互いの強みと弱みを補完しながら、戦略的方向性を共有している点も注目に値する。
EMCは、ビッグデータを超高速に分析処理する製品(Greenplum)を提供しているが、データ処理速度という部分だけではなく、その活用方法までを包括的に見据えた戦略を打っている。これまで曖昧とされてきたビッグデータの活用イメージを具現化すべく、データサイエンティスト部門を立ち上げて面的に攻めているわけだ。これはEMCに限らず、アナリティクスをリアルなソリューションに埋め込もうとしているベンダー全体に見られる方向性である。
ゴール設定なきところに成功なし
ゴール設定なきところに成功なしとはよく言ったものである。前回までの寄稿で触れた赤池情報量規準の故赤池先生といい、後述する正規分布の確率密度関数や素数定理の生みの親となったガウスといい、彼らが定理を生み出した背景には単純明快な共通項があった。それが強い想いや課題認識と解決策の策定といったゴール設定である。
ガウスは、シュミレーションで使われるモンテカルロ法の原型となるランダム・サンプリング手法を考案したのだが、それは偶然ではなく必然性を持っていた。素数の出現頻度を調べている過程で「繰り返しの手計算は面倒くさい。手間を省けないだろうか?」という彼自身の課題認識と強いニーズから発明に至っている。
逆に言うと課題認識や解決したい方向性がない方々からは、いくら大量のデータをいただいたところで、何ら解決することはできないと言う筆者なりの結論がある。もちろん試行錯誤の中から、天才により偶然発見されるパターンもあるが、現実問題そういう「運」を頼みにしたアプローチは、ROIを厳しく見られるビジネスでは取り難い。