海外旅行中、レストランで困るのが、料理メニューが読めないことだろう。近くのテーブルの客が食べている料理を指差して「同じもの」とオーダーするのも1つの手。でも、できればメニューを吟味して頼みたいものだ。
そんな悩みを解消してくれるのが、NTTドコモが提供する料理メニュー翻訳アプリだ。同社のアンドロイド対応スマートフォン向けで、カメラ越しに外国語の料理名を画面に映すだけで、瞬時に日本語訳を表示できる。中国語、韓国語、英語に対応しており、今年9月16日~来年1月16日間に無料でトライアル提供し、ユーザーの意見や要望などを集める。
NTTドコモを取材し、デモを見せてもらった。画面中央の長方形の窓に韓国語の料理名を合わせると、すぐに画面左下に「石焼ビビンバ」と表示された。筆者のようにハングル文字を全く読めない者にとっては、韓国旅行で強い味方になる。料理について、さらに詳しく知りたい場合は、画面右下の「共有ボタン」をクリックすれば、「Google」や「Wikipedia」など設定した検索サービスで調べられる。
このアプリの優れた点は、文字認識技術の精度が非常に高いことだ。従来、携帯電話のカメラを使った光学文字認識処理(OCR)では、取り込んだ文字が言葉として認識できない場合があるなど問題があった。
今回は、OCRで認識した文字と辞書データの全単語を高速で照合させ、最も確実性の高い単語を検出する技術を新たに開発した。この技術により、文字認識の精度と速度が飛躍的に向上し、翻訳した料理名を瞬時に表示させることが可能となった。現在、料理名の辞書データは、中国語、韓国語、英語、それぞれ約1万語だが、これを100万語に大規模化しても、高速の文字認識を維持できるという。
ところで、今回のアプリは、NTTドコモが開発を進める文字認識技術の一部を使っているに過ぎない。実は、文字を「窓」のような限定された範囲の中だけで抽出するのではなく、画面に映るすべての文字を抽出し、高速かつ正確にOCR処理する技術を既に開発している。
この技術を使うと、たとえばスマホを中国の街角でかざせば、画面に映る道路標識や店の看板などの文字情報をすべて抽出し、それぞれを瞬時に翻訳して表示することも可能になる。ユーザー情報を登録しておけば、関心を引きそうな文字情報だけを表示させることもできる。「居酒屋」を関心事として登録すれば、画面上にはお酒が飲める店の文字情報のみが表示されるわけだ。
さらに、文字情報に様々な詳細情報(観光関連、販促関連など)を付加することも可能だ。つまり、現実の環境にコンピュータを用いて補足情報を重ねて提示するAR(拡張現実)を、文字認識技術から実現するものであり、いわば、便利でリアルタイムな「ARガイドブック」となる。
これはあくまで一例である。他にもアイディア次第で様々な活用法がありそうだ。NTTドコモでは、新開発の文字認識技術のAPIを公開する。従来は風景のように複雑な画像に含まれる文字の認識は困難だったが、このAPIを利用すれば、精度の高い文字認識が可能だ。ソフトウェア開発者は登録すれば、ナビや地図、辞書、翻訳、旅行、物品管理など様々なジャンルのアプリやウェブサービスが開発できる。
NTTドコモでもこのAPIを使い、スマホで撮った画像から検出した文字を文字入力に利用できるアプリ「撮って文字入力」を開発する。中国語、韓国語、英語、日本語に対応予定。国内では読めない漢字、海外では看板に書かれている文字などの意味を、辞書や翻訳アプリで調べられる。今年12月から6カ月程度無料提供する計画だ
「技術をオープンにして、サービスに広がりを持たせたい。将来的には、カメラ越しに文字を表示すれば、自分が知りたい情報を何でも教えてくれるようなサービスを実現したい」と、NTTドコモ研究開発センターサービス&ソリューション開発部の岩崎淳氏は話す。ソフトウェア開発者が自由な発想で生むアプリに期待したい。
(大来 俊/5時から作家塾(R))