「特徴量のエンジニアリング」と
「超不均衡データへのアプローチ」
金融犯罪対策センター
小森美武センター長
FC3センター長である小森美武氏は、AIを活用することに至った理由を次のように説明する。
「これまでもルールベースという方式を用いた不正検知システムはありました。しかしルールベースは、新しい手口の検知ルールを組み込むのに手間がかかり、検知レベルを高め過ぎると正規の利用を不正と誤検知するケースが増加するため、実用の場合は検知レベルを落とさざるを得ないという欠点がありました。当社のAIを利用すれば、ルールベースよりも誤検知や運用コストを少なく抑え、かつ検知精度を高めることが可能になるのです」
ラックのAIエンジンは金融犯罪対策に特化したもので、二つの特徴があるという。一つは「特徴量のエンジニアリング」。特徴量というのは、犯罪者のさまざまな犯罪パターンのことで、犯罪を判断する基準になる。例えば、いつもは店舗内のATMを利用して20万円以上は引き出さない高齢者が、夜間のコンビニで30万円引き出すなど普段と大きく異なる取引は“犯罪”の可能性が高くなる。ラックでは、そうした数百にわたる特徴量を想定し、それぞれの特徴量の数値も細かく設定した。
「この特徴量の想定と設定は、金融犯罪手口に対する深い知見がなければできませんが、実は私自身が、かつてメガバンクで金融犯罪対策の陣頭指揮を執っていた経験者。そこで培った知見を大いに活用しています」と小森氏は説明する。
もう一つの特徴は「超不均衡データへのアプローチ」である。金融犯罪の不正検知における課題は、データが非常に偏っているということ。銀行の取引データは大量に存在するが、そのほとんどは正常取引で、不正取引はごくわずか。不均衡データに対するアプローチはAIの苦手な領域で、そのまま学習を行うと、不正取引の特徴が無視されてうまく検知ができない。
AIプロダクト開発チーム
ザナシル・アマルリーダー
「そこで、数少ない不正データをかさ増しすると同時に、正しい取引データを間引いて調整し、データをAIが分析可能な一定の比率にしてから、AIに学習させました。つまり学習用データの比率調整を行うことで、検知率が最も高くなるAI分析手法を開発したのです」
そう話すのは、ラックのAIプロダクト開発チームリーダーのザナシル・アマル氏だ。