プロが見落とした
重要文書も発見

 プレディクティブ・コーディングと人的レビューの違いについて、武田氏はこう説明する。

「人手で仕分けする場合、メールや契約書、提案資料などすべての文書を閲覧する必要があります。UBICのプレディクティブ・コーディングは磁石のようなものです。関係性の高低に応じて文書をスコアリングし、スコアの高いものから低いものへと並べるのです(図)」

 レビュアーは高スコアの文書から順にレビューを行い、関係のある文書が出てこなくなったらレビューを終了する。ただし、どこでレビューをやめるかは訴訟の戦略に関わる。通常、それは弁護士の判断だ。

 プレディクティブ・コーディングを利用する際は、まず“先生”によるサンプリングが行われる。つまり、エキスパートのレビュアーが見本を見せる。これをコンピュータが学んだ上で、文書を判断するためのモデルをつくる。そして、サンプル以外の文書をITの力でレビューするのだ。

 UBICはディスカバリ事業者として、プレディクティブ・コーディングをはじめさまざまな独自技術を開発してきた。もともとデジタル・フォレンジックと呼ばれる不正調査の分野で設立し、証拠文書の保全や調査などを行ってきたが、その技術やノウハウを応用して、その後すぐにディスカバリの領域に進出。10年間の経験を積んできた。UBICでは、プレディクティブ・コーディングをフォレンジックに活用するケースもあり、これは世界唯一の技術だ。

「ある企業で不正が発覚し、調査が行われたときのことです。疑いの高いPC20台の中から2台を抽出し、調査員が分析しましたが、重要文書は見当たりませんでした。そこで、プレディクティブ・コーディングを用いて分析したところ、疑いのある文書を発見。残り18台でも重要な証拠文書を発見しました」

 これも、コンピュータに任せたほうが高品質を期待できる分野の一例だ。こうしたUBICの技術を根底で支えているのが、ユニークな技術開発スタイルである。

「当社はディスカバリ支援サービスを提供するとともに、そのために必要な技術を開発しています。サービスの現場で必要なものがあれば、開発チームにフィードバックされ開発・実装されます」と武田氏。サービス提供と技術開発が密接に連携することで、スピーディーな機能追加や改善を実現する。そこにUBICの大きな強みがある。

■この記事の続き「韓国企業が直面する課題を通して考える今後のディスカバリ対策」を読む