重要な政治決定の裏側には、スパイが絡んでいる。かつての国際的な危機や紛争、国家元首の動きもすべてお見通しだった。それは単なる偶然ではない。政治指導者の力でもない。さまざまな情報を分析したスパイたちのおかげだった。イギリスの“スパイの親玉”だったともいえる人物が『イギリス諜報機関の元スパイが教える 最強の知的武装術 ――残酷な時代を乗り切る10のレッスン』を著した。スパイがどのように情報を収集し、分析し、活用しているのか? そのテクニックをかつての実例を深堀りしながら「10のレッスン」として解説している。マネジメントを含めた大所高所の視点を持ち合わせている点も魅力だ。本書から、その一部を特別公開する。

【イギリスの元スパイが説く】分析官が直面する「フォールスポジティブ」「フォールスネガティブ」のジレンマPhoto: Adobe Stock

より正しいか、より間違いが少ないかの選択

情報分析官が侵略行為を警告しなかったとすれば、批判されてもしかたない。彼らも失敗を非難されるのは覚悟している。また、悲観的な報告をしなかった失敗を非難されるよりも、フォールスポジティブ(誤った判断)から注意を喚起するリスクを負うほうがいいと考える。

有事の際には、タイムリーに警告を発することができなかった代償が、警告を発しながら何も起こらなかった代償よりも大きいことが多い。情報分析官は現実主義者で、不要な警告を発した言い訳に使える理由がたくさんある、と皮肉屋から言われるかもしれない。だが、警告をしなかったせいで政策立案者を驚かせるようなことになれば、言い訳は許されない。

分析官が直面する状況は、フォールスポジティブかフォールスネガティブかという品質管理の問題とも言える。自動車メーカーが直面するのと同じジレンマだ。自動車メーカーでは、工場出荷時の検査で、欠陥車をどれだけの割合で合格させるかを決めなければならない(安全とみなされるが安全ではないというフォールスポジティブ)。

欠陥車は故障する可能性があるし、巨費を投じてリコールしなければならないうえに、企業の評判に傷がつき、売り上げにも響く。その一方、安全ではないと誤って判断されて不合格になる車があまりに多ければ(安全でないとみなされたが安全というフォールスネガティブ)、製品を組み立て直すのに多額の余計な費用がかかる。

薬品や食品の分野ではより切実だ。消費者は、ナッツアレルギーのある人が死につながる危険なものを食べないようにするために、食品にナッツが入っていないことを表示するように求める。そこで製造業者は検査を厳しくしてフォールスポジティブ(誤検出)の割合を下げなければならないが、そうするとフォールスネガティブによる不合格率が上がるため、その費用が製品価格に上乗せされる。

製造業者がフォールスネガティブが増えてもフォールスポジティブをできるだけ避けようとする一方で、ソフトウェア業界では、費用を理由にフォールスポジティブの多さを容認している。つまり、製品を使用した顧客が不具合を経験するたびに、次々と修正プログラムを配布する。

情報とセキュリティの分野では、対象となる個人が「搭乗拒否リスト」に載るような暴力的過激派組織とつながりがあるかどうかを判断するとき、この問題に直面する。政策立案者は慎重すぎるくらい慎重に検査をしていいと考えている。つまり、多くのフォールスネガティブを容認する。危険人物と誤って判断された人は飛行機に乗れなくなるが、それはフォールスポジティブの水準を厳しく設定したことによる代償だ(テロリストを安全ではないのに誤って安全だと判断すれば、爆弾が持ち込まれて旅客機が爆破されるという最悪の事態が起こるかもしれない)。

諜報機関が大量の通信データからテロ容疑者に関する情報を引き出すためのアルゴリズムの設計についても、同じことが言える。フォールスポジティブの割合を大きくしすぎると、関連性の低い情報が多くなって情報分析官の貴重な時間が無駄になるうえに、不必要にプライバシーを侵害する恐れもある。

反対にフォールスネガティブを過度に避けようとすると、求めていたデータが手に入らず、テロリストを見逃すかもしれない。何が最適かはフォールスポジティブとフォールスネガティブの相対的な重要度を秤はかりにかけなければわからない。一方、[レッスン4]で述べるように、人間を危険にさらすリスクがあるなら、フォールスポジティブは許容できないという予防原則もある。そのような原則を適用するには、相当な犠牲を強いられる。

フォールスポジティブかフォールスネガティブかのジレンマは、データを分類するアルゴリズムについても生じる。アルゴリズムは正しい分類が行われた(容疑者か容疑者でないかなど)過去の大量のデータから学び、AIのプログラムによって、最も効率的なデータ分類の基準をはじき出す。だが、アルゴリズムを採用する際は、その精度をインプットデータの既知の特性に照らして評価する必要がある。

アルゴリズムによる判断は、既知の過去データに比べて、たとえば95%正しいというように単純に数値を設定すれば、フォールスポジティブとフォールスネガティブの割合や、それぞれが生じる不利益によっては問題につながりかねない。アルゴリズムが学んだデータのなかでポジティブとして検出されたデータと、真にポジティブであるデータの割合を測ることも、タスクに対するアルゴリズムの精度を評価する方法の1つになる。

精度は、学んだデータの総数に対する真のポジティブとネガティブの数として測定されることも多い。ビッグデータを用いる最新の統計テクニックでは、設定した各数値に対して予想されるフォールスポジティブとフォールスネガティブの数を図式化し、曲線下面積(AUC)をタスクの成功の指標とする。

デビッド・オマンド(David Omand)
英ケンブリッジ大学を卒業後、国内外の情報収集・暗号解読を担う諜報機関であるイギリスの政府通信本部(GCHQ)に勤務、国防省を経て、GCHQ長官、内務省事務次官を務める。内閣府では事務次官や首相に助言する初代内閣安全保障・情報調整官(日本の内閣危機管理監に相当)、情報機関を監督する合同情報委員会(JIC)の委員・議長の要職を歴任したスパイマスター。『イギリス諜報機関の元スパイが教える 最強の知的武装術 ――残酷な時代を乗り切る10のレッスン』を刊行。