OCRよりも “人力”オペレーションの方が入力精度が高い理由

なぜ、デジタル全盛の時代に、TOKIUMはアナログの“人力”オペレーションを採用しているのか。

「それはオペレーターの目視による入力の方が、OCRよりはるかに入力精度が高いからです」

同社オペレーション部の吉見光司部長は、人力に頼る大きな理由をそう説明する。「もし人の目と脳と同じ能力を持つOCRが存在するのなら、私たちも利用するでしょう。でも、現在世の中に存在するOCRは、指定箇所を読み取ること、読み取った内容を書き起こす能力には優れていますが、指定箇所を探す能力はまだまだなのが実情です」。

領収書として受け取ったレシートを思い出してほしい。金額が複数箇所に印字されている。この数字のうちのどれを入力すればいいのか。全部か、一つだけか。「その判断がOCRにはできないのです。今の段階では人が目で探して脳で判断し手で入力する方が、明らかに精度が高い」(吉見部長)のである。

OCRだけに頼ったシステムでは、TOKIUM経費精算ほどの精度は出せない、と吉見部長は自信を見せる。「データ入力結果が間違っていたら、経理担当の方が領収書と照らして修正しなければなりません。その経理担当の方の負担を最大限減らしたいという思いで、当社は“人力”の入力を採用しているのです」。

不断の業務改善でデータ入力完了までの時間を劇的に短縮

しかし、ここで疑問が二つ浮かぶはずだ。

「本当に精度が高いのか」
「短時間で入力できるのか」

まず「本当に精度が高いのか」について、図1のオペレーションのフローを見てみよう。ユーザー企業が領収書をスマホで撮影して画像をアップロードすると、TOKIUMのオペレーション部では、次のような作業が行われる。

まず1人目のオペレーターのPC画面に、アップロードされた領収書の画像が表示される。それを見てオペレーターは必要な項目(支払先、日付、金額、インボイス登録番号、通貨など)を手で入力してデータ化する。これで終わりではない。

少し時間を置いて2人目のオペレーターのPC画面に同じ画像が表示されるので、同様に目で見て手で入力する。「私たちは『ダブルエントリー』と呼んでいるのですが、オペレーター2人の入力結果が一致して初めてデータ入力が完了し、ユーザー企業に入力完了が通知される仕組みになっています」。

つまり、入力時に人が目視して手入力することで精度を高めているだけでなく、2人のオペレーターによる入力(ダブルエントリー)の結果が一致(二者一致)するかどうかを確認する何重ものチェック体制を敷くことによって、TOKIUM経費精算では99%以上*という高い入力精度を実現しているのだ(*当社規定の条件を満たした書類における、対象項目当たりの精度)。

ここでもう一つの疑問、「短時間で入力できるのか」についての疑念が深まる。ただでさえ人の目と手を介した入力作業は時間がかかる上、ダブルエントリーでチェックするとなると、データ化に相当な時間がかかってしまうのではないか、と。

「実際に1年ほど前までは、入力完了まで1時間程度かかっていましたが、日々改善に取り組み、今はわずか5分(中央値)で完了します」と吉見部長は疑念を一蹴する。どうやってそこまで時間を短縮することができたのだろうか。

かつて入力に1時間もかかっていた最大の要因は、オペレーターの戦力化までのプロセスにあった。同社のオペレーターはいわゆるクラウドワーカーと呼ばれる業務受託者で、常時募集をかけていた。応募者は多いのだが、以前は入社手続きが週1回しかなく、採用してから稼働するまでかなり時間がかかっていた。

そこで、採用から入社、アカウント発行、トレーニングまでをほぼ自動化することで、採用したオペレーターの即稼働・即戦力化を可能にした。

ただし、人員不足だからといっていいかげんな採用をしているわけではない。入力の正確さや速さを測るテストやトレーニング、顧客の情報を扱う心構えといった教育は入社時にしっかり実施しており、量と質を両立させている。

オペレーション部の人員は現在、正社員・アルバイトを含め約150人。業務委託のオペレーターは2000人以上いて、時間帯などにもよるが、1時間当たり最大1000人くらいが稼働している。

また、オペレーターが入力を行うPC画面のUI(ユーザーインターフェース)が使いやすいことも、精度やスピードに大きな影響を与える。この画面も継続して改善しており、こうした努力によって、「99%以上の入力精度」で「5分でデータ化完了」を実現している。