かのマイクロソフトの元会長であるビル・ゲイツ氏は、自社が競争上優位に立っているのは、ベイズ統計学のおかげだと語ったことがあります。医療、軍事など、さまざまな分野で使われているこの理論について、耳にしたことがある人もいるかもしれません。
では実際どのようにビジネスに応用されているのかを、『完全独習 ベイズ統計学入門』の著者である小島寛之教授が解説します。
軍事、医療の分野で注目され、
再び表舞台に戻ってきたベイズ統計学
この連載の前3回では、主にベイズ統計学の仕組みについて説明した。今回は、ベイズ統計学のビジネス利用についての紹介をしよう。
ベイズ統計学が、19世紀の終わりから20世紀の始めにかけて、フィッシャーやネイマンらの激しい批判を浴びて、いったんは駆逐されて表舞台から消え去ったことは、第2回で述べた。批判は、ベイズ統計学の推定が主観確率という怪しげな概念を基礎に計算されていることに集中していた。客観性を重んじる科学の立場からは、確率を主観的な数値として設定することは受け入れ難い、という意見があるのは理解できることだ。
ところが、1950年代になって、ベイズ統計学は復活の狼煙をあげた。サベージという統計学者が、主観確率を伝統的な確率論と調和させることに成功したことが皮切りだった。その後、ベイズ統計学には高い実用性があることがわかって来て、再注目されることとなった。軍事関係者の間で、ミサイルの信頼評価にベイズ統計学が使われた。データが少ないため、スタンダードな統計学(ネイマン・ピアソン統計学)は役に立たなかったのだ。他方では、医学の研究でもベイズ統計学が分析に用いられるようになっていた。
マイクロソフト、グーグル、アマゾン……
IT企業大手が活用しているベイズ統計学
そんな中、最も衝撃を与えたのは、ベイズ統計学のビジネス利用だった。1996年にマイクロソフト社のビル・ゲイツが、ベイズ統計学の専門技術によって競争で優位に立っていることを新聞で語った。実際、ウィンドウズには、ヘルプ機能などにベイズ統計学が利用されている。
また、ウェブ上の検索機能にもベイズ統計学の技術を応用した。ゲイツは、2001年の基調講演において、21世紀のマイクロソフト社の戦略はベイズであると高らかに宣言し、ベイズ統計学の研究者を多数ヘッドハントしたことを明らかにした。それでベイズ統計学は、いきなりビジネスシーンの最注目キーワードに躍り出たわけなのだ。
ベイズ統計学の利用は、インターネットの普及に伴って急速に広がった。それには、2つの理由がある。第一は、コンピューターの高速化が、ベイズ統計学のネックであった計算の複雑さを軽減したこと。第二は、ベイズ統計学の分類機能(これは第3回に解説した)が、ネット上で最もその威力を発揮することだ。
ベイズ統計学には、データが少なくてもそれなりに推定でき、データが多くなるとより正確度が増す、という特徴がある。これを「学習機能」と呼ぶ。学習機能についての詳しい説明は、本エントリーの字数では不可能なので、拙著『完全独習 ベイズ統計学入門』で学んで欲しい。
要するに、ネットに仕込まれたベイズ統計学の推定機能は、学習によってどんどん賢くなる、という性向を持っている、ということだ。これは、ネット上に人工知能を潜ませることが可能であることを意味している。マイクロソフトもグーグルもアマゾンも、ベイズ統計学を人工知能として利用していることは疑いない。
人工知能による推論の一種は
ベイズ統計学のしくみを利用している
人工知能の研究でも知られる数理論理学者の新井紀子さんによれば、人工知能に出来る推論は、「論理的推論」「確率的推論」「統計的推論」の3つしかない、ということだ。ここでいう統計的推論とは、要するに、「類似性を評価する」と言い換えてもいい。
この観点から言うと、前回解説した、ベイズ統計学を使った迷惑メールの選別は、結局は、「受信したメールが、どの程度、典型的な迷惑メールと似ているか」ということを数値評価している、と見なすことができる。まさに、類似性の評価である。そういう意味では、ベイズ統計学を使った推定は、人工知能の一種と言えるわけだ。
類似性の判断、すなわち、「似ている」という判断は、主観的な判断に他ならない。そういう意味では、ベイズ統計学が主観確率を用いていることは、科学的な方角から否定されても、人工知能という方角からは逆にポジティブに受け取れることなのである。
今や、ベイズ統計学は、ビジネスに必須のテクノロジーと言っていい。ウェブ上や、店頭の端末にベイズ統計学を使ったソフトウェアを仕込むことは、有能な人工知能を配置して、顧客対応をさせることと同じである。24時間不休で働き、働けば働いただけ賢くなる社員を部下にするようなものである。もちろん、人間の社員のようには、機転は利かないだろうし、無視できないほどの間違いをしでかすだろう。そうであったとしても、ベイズ統計学のテクノロジーをどう活かすかが、今後のビジネスの明暗を分けることは疑いないことだ。