ダイヤモンド社のビジネス情報サイト
データサイエンティストの冒険

現場の状況に即した打ち手を返すためのアナリティクスとは

工藤卓哉 [アクセンチュア]
【第2回】 2012年8月27日
著者・コラム紹介バックナンバー
previous page
2
nextpage

 リスク回避の統計確率論の手法の中で、「Expect the unexpected」(予測できないことを想定する)という原則がある。ボーイスカウトの「備えよ常に!」という言葉は、そのことを普通の言葉で言っているのに近い。

 効率性を志向する統計技術者は、こうした問題にアプローチする場合、確率論を用いて簡便な検定手法を使うだろう。突発的事象に対して、過去のデータから将来リスクを極力「費用効率的」に回避したいと考える。この時、突発事象が特定要因に起因して発生する(≒統計的有意性がある)ことを、「違いの度合い」で立証するより、違いは一切ないという仮説(これを帰無仮説という)を論破するかたちで立証する立場をとる。「痛いか?」と聞かれて、どの程度痛いか?を答えるのは十人十色で主観的な回答になりがちで困難だが、100%痛くないのか?と、断定的に聞かれたら答えやすい。これと同じである。

 このため統計学を適用する統計技術者やアナリティクスに携わる技術者たちは、水害データを眺めた後、冷静に次の打ち手のためにこう問いを投げるだろう。「事象(水害)が起こる確率は、通常の降水量と豪雨時のそれを比較した場合同じか?」(≒水害発生は偶然によるか?)と。

 ここで、統計学では、通常受け入れてもいい閾値を設け(専門用語で有意水準やα値などと言うが、覚える必要はない)、そこを判別基準として仮説を検証する。「偶然による発生率が5%以上か10%以上か」(p-value>α=0.05有意水準か?など)といった具合である。この問いかけの答えが、「ノー」(p-valueは5%未満→帰無仮説を棄却という)であれば、それは偶然によらず、降水量の違いが要因として認められると結論付け、政策設計やビジネス戦略のインプットに降水量という因子(≒説明変数などという)を考慮する。

 ビジネス戦略と違い、公共政策で問題となるのは「イエス」(p-valueは5%以上)のケースである。この場合、統計学の世界ではそれら事象が偶然の機会によるランダムなものと見なして、事象は統計的に有意でないと考え、降水量を無視する。こうなると、降水量は災害対策に考慮されないかもしれないし、極論すると対策が講じられることもない。

 しかし公共財や公共政策において、そうしたアプローチは受け入れられない場合がほとんどだろう。たとえば、原発の設計において、地震の発生頻度、津波の発生率が低いと言って、なんのリスク回避策も講じないことが許されるであろうか? 答えはもちろんノーである。こうした領域においてはリスクに対する対策を考えるべきである。ミクロ経済学の公共政策論で、「超過負担(excess burden)」や「死重の損失(dead weight loss)」といった追加的な厚生損失の概念で、議論されていることだ。これは統計の仮説検定思想には矛盾しているが、Expect the unexpectedの原則には合致する。

previous page
2
nextpage
IT&ビジネス
クチコミ・コメント

facebookもチェック

工藤卓哉
[アクセンチュア]

Accenture Data Science Center of Excellence グローバル統括 兼
アクセンチュア アプライド・インテリジェンス マネジング・ディレクター
ARISE analytics Chief Science Officer (CSO)

慶應義塾大学を卒業しアクセンチュアに入社。コンサルタントとして活躍後、コロンビア大学国際公共政策大学院で学ぶため退職。同大学院で修士号を取得後、ブルームバーグ市長政権下のニューヨーク市で統計ディレクター職を歴任。在任中、カーネギーメロン工科大学情報技術科学大学院で修士号の取得も果たす。2011年にアクセンチュアに復職。 2016年11月より現職。 データサイエンスに関する数多くの著書、寄稿の執筆、講演活動を実施。


データサイエンティストの冒険

近年テクノロジーと数理モデルによってもたらされるアナリティクスが、ビジネスを大きく変えようとしている。データの高度な活用から次の打ち手を見出す力、アナリティクスの決定的な優位性を最前線から解説する。

「データサイエンティストの冒険」

⇒バックナンバー一覧