自動翻訳というと、グーグル翻訳やDeepLを思い浮かべる人が多いかもしれないが、実は国産のAI翻訳が、特許、製薬、金融などの専門分野での高精度化をはじめ、すさまじい進歩を遂げている。なぜ精度が急速に上がったのか。どのような産業でどのように役立てられているのか。そして、今後ビジネスではどのように応用される可能性があるのか。一般社団法人アジア太平洋機械翻訳協会(AAMT) 会長で国立研究開発法人情報通信研究機構(NICT)フェロー隅田英一郎氏に聞いた。(ライター 奥田由意)
特許、製薬、金融など専門分野や
音声翻訳でも高精度を実現
AIを活用した国産の自動翻訳(機械翻訳)が世界的にも高いレベルにあることは、あまり知られていないかもしれない。
国立研究開発法人情報通信研究機構(NICT)の研究成果による自動翻訳は、英、中、韓など10言語に関して、旅行、医療、防災等の分野に対応し、日本語と外国語、双方向の翻訳精度は80%以上で、実用レベルである。2019年にはTOEICスコアでも960点以上の実績を上げている。また、音声認識の精度も今や人間を超えている(時間をかけて何回か録音を聞き直すことを許容すれば、文脈を理解する能力がある分だけ人間のほうが正確ではある)。
これらの最先端技術は、現在累計80万台を売り上げている82言語対応の双方向翻訳機ポケトーク、自治体での業務やインバウンド対応のための翻訳機eTalk5みらいPFモデルなどをはじめ、約30の製品がビジネスの現場で使われている(製品・サービス事例)。
こうした製品以外にも、企業他との共同研究で、専門分野の自動翻訳の精度が飛躍的に上がっている。NICTでは、特許庁、製薬会社などとしっかりタッグを組んで、研究開発を進め、それぞれの専門分野に適応した高精度翻訳を実現し、外国出願を効率化したり、新薬の販売承認にかかわる翻訳日数を短縮したりしている。
一般社団法人アジア太平洋機械翻訳協会(AAMT)会長 国立研究開発法人情報通信研究機構(NICT) フェロー
1955年生まれ。1982年電気通信大学大学院修士課程(電子計算機学専攻)修了。1999年京都大学大学院博士(工学)。日本アイ・ビー・エム、国際電気通信基礎技術研究所を経て2006年情報通信研究機構(NICT)へ。2016年から現職。2017年から総務省とNICTで連携して、自動翻訳の高精度化のために、対訳データの公的集積所「翻訳バンク」を運営している。2025年がゴールの音声翻訳の国家プロジェクトを推進。2018年からアジア太平洋機械翻訳協会会長も務める。
NICTフェロー隅田英一郎氏は「グーグル翻訳においては精度を上げることが必ずしも最優先事項ではない。グーグル翻訳は広告ビジネスへの貢献がその存在理由であって、汎用の単品として設計されている。汎用品とは包丁で例えれば万能包丁のようなもの。何でも切れるといっても、生魚の身やパンはうまく切れず、結局、刺身包丁やパン切りナイフが必要になる。包丁と同じで、翻訳も専門に特化した自動翻訳でなければ用をなさない」と語る。
NICTでは、研究室に研究を閉じ込めず、専門分野の官・民と協力して、重点分野について、実際にその分野で使われている高品質で大量のデータを機械学習(深層学習)させ、それを協力相手の現場に戻して厳しくチェックしてもらい、調整を重ねることによって高精度を実現している。
「専門の組織や企業と一緒に作ることで、リアルな必要性に基づいたフィードバックが確実に得られ、短期間にシステムに反映して実用に供することができている」(隅田氏)
例えば、外国での特許訴訟における費用の多くを翻訳が占めるので翻訳の低コスト化が必要であり、一定期間に大量に翻訳するので高速化も必要だった。また、特許査定までにやり取りされる「拒絶理由書」は、特許明細書の独特の文章と、普通のスタイルの文章が混在した、とりわけ翻訳困難な文書だ。NICTは2014年から特許庁と協力して自動翻訳の開発を続け、異なる2つの評価尺度であるRIBESとBLEUの組み合わせで世界一の翻訳精度を達成した。