テレワークが普及し、社員のリモート環境での業務を監視したいと考える管理職や経営者も増えているだろう。そうしたなかで、テクノロジーを駆使した「監視」の最前線はどうなっているのか。国際的な訴訟などで必要な証拠となる電子データの保全、調査・分析を20年近く手掛けてきた「デジタル・フォレンジック調査」のパイオニアでリーガルテックの最先端企業であるフロンテオを取材した。(ライター 奥田由意)
ほとんど違いがないのに
一方は不正を示唆するメール
図の2つの文章を見比べてほしい。ひとつは談合のための会合のメールで、もうひとつはただの飲み会のお誘いメールだ。どちらが摘発対象で「アウト」となるメールなのか分かるだろうか。
正解はBである。確かに文面は多少違うが、法務担当者でもない限り、どちらが明らかにアウトなのかを見抜くことは難しいだろう。もちろん違いはあるのだが、不正を示唆する差異となると、それは勘、経験の蓄積による「暗黙知」の領域である。
だが、フロンテオが独自に開発した自然言語を解析するAIエンジン「KIBIT(R)(キビット)」は、自動的にこれを判別する。大量のメールや文書のテキストを解析し、そのなかから、違法となるメールや書類を探し出すのだ。
言うまでもないことだが、メールの件名や文中に「談合」というキーワードがあるわけではなく、キーワード検索は使えない。実際に不正の行われるもととなった文面を集めて、使われているキーワードの組み合わせなどを抽出したところで、そこには、「飲む」や、「居酒屋」といった罪のない普通のメールに使われる言葉しかないので、これも検索のキーワードとして使うことは有効ではない。
言語は子どもでも学習できるし、子どもでも本は読める。AIの専門家でない人は、言語を高性能のAIに学習させるのは、たやすいことだと思うかもしれない。
フロンテオの代表取締役社長・守本正宏氏は「人間が一度に学習できるよりもはるかに多量のデータを読み込ませれば、ディープラーニングで言語法則や言語体系を習得することは可能だろうという仮定で、これまで多くの自然言語解析のAIの開発が行われてきた。しかしそのやり方では、われわれが従事するような裁判の証拠に使える特定の不正文書を見つけるようなことは到底できない」と断言する。