「ぎこちない翻訳」を一変させたGoogleのニューラルネットに基づく機械翻訳

そもそも、今ではほとんど​​見られなくなったGoogle 翻訳の「ぎこちなさ」はなぜ生み出されていたのか。賀沢氏によれば、当初のGoogle 翻訳では「フレーズベース機械翻訳」と呼ばれるシステムが採用されていたという。これは文中の単語やフレーズを個々に翻訳するスタイルだったため、冒頭でも触れたように「ぎこちない翻訳」となることが多くなっていた。

「ご存じのとおり、言語は多様であり、かつ複雑です。翻訳するにはさまざまなルールを付け足す必要がありました。それを、人間だけで対応するのは不可能。そこで、フレーズベース機械翻訳であらゆるデータをカバーしようと考えたのです」(賀沢氏)

ここで、思わぬ壁と向き合うことになる。フレーズベース機械翻訳は、単語や句の訳は得意なものの「どんな順番で一文にすればいいのか」が難問だった。その最たる例が、語順も文法も異なる日本語と英語の翻訳だ。この関係性によって、「ぎこちない翻訳」が誕生していた。

Google翻訳の開発を担当する賀沢秀人氏
Google翻訳の開発を担当する賀沢秀人氏

データを揃えつつ、地道に改良を加える日々が続く。そのスピードは「三歩進んで、“半歩”下がる」ようなものだった。そんな状況をガラリと変えたのが、冒頭でも触れたニューラルネットワークだ。

「ニューラルネットを取り入れたGoogle 翻訳は、データの中から自動的に翻訳のためのモデルを作ります。文章全体を鑑みて訳すので、文脈に沿った自然な翻訳ができるんです。おかげで、ぎこちない翻訳は大幅に減りました」(賀沢氏)

ニューラルネットに基づく機械翻訳の導入後、英語からフランス語、そして英語からドイツ語の翻訳で、誤りを平均60%低減させるなどの結果を見せた。

2016年にニューラルネットに基づく機械翻訳の導入により進化したGoogle 翻訳
2016年にニューラルネットに基づく機械翻訳の導入により進化したGoogle 翻訳

Googleとしては試験運用期間を経てから、正式にニューラルネットに基づく機械翻訳の導入を発表するつもりだった。ところが、ユーザーがGoogle 翻訳の変化にいち早く気づき、2016年11月ごろから、Twitterなどで「翻訳の質が良くなっている」と騒ぎ始めたという。

「とても驚きましたね。そして、翻訳の質が良くなればすぐに気づいてもらえるんだと手応えを感じました。ニューラルネットに基づく機械翻訳の導入は、めったにない技術のブレイクスルーだと思っています。僕自身も、技術が進歩すると見える景色が変わるのだと体験できました」(賀沢氏)

増え続ける言葉、国や状況によって変化する言い回し

サービスは、ニューラルネットに基づく機械翻訳を採用して終わり、とはならない。

このシステムを使っても、完璧な翻訳ツールになるまでの試行錯誤はまだ続いている。翻訳の精度は格段に上がったが、学習データの量や質によっては、誤った翻訳になることもある。賀沢氏も「『なぜうまくいかないのか』と思うことは今もあります」と話す。