機械翻訳写真はイメージです Photo:PIXTA

Google翻訳やDeepLなど、機械翻訳の進歩がすさまじい。どのような技術革新があったのか。さらに精度が上がるとコミュニケーションはどう変わるのか。また日本人が英語を勉強する必要がなくなる日が来るのか。長らく機械翻訳に携わる第一人者のNTTコミュニケーション科学基礎研究所 協創情報研究部 言語知能研究グループ上席特別研究員・永田昌明氏と本連載『組織の病気』著者である秋山進氏が2回に分けて「進歩がすさまじい機械翻訳の現在と未来」について語り合う。後編では、機械翻訳が今後どのように発展し、人の言語運用はどう変わるのか、英語学習はどうなるのか、社会へのインパクトについて話題が広がった。(取材・構成/ライター 奥田由意)

>>前編『進歩がすさまじい「機械翻訳」、その理由をトップ技術者に聞く』から読む

文学の翻訳は
いずれは可能になるか

秋山 前回はニューラルネットの真髄は意味表現を数値ベクトルにするところにあるというお話でしたが、機械翻訳はどこまで発展するんでしょう。文学も翻訳できるようになりますか。

永田 文学は難しいですね。直訳でないもので言うと、新聞記事はやがて自動翻訳可能になると思います。例えば読売新聞とジャパン・ニューズは完全対訳ではありませんが、基本的に同じ内容の記事を載せています。その際に、日本語では自民党総裁選のニュースを自民党総裁についての解説なしにそのまま書いていますが、英語版では、自民党総裁は日本の首相になるなどの補足説明を付けています。このような補足も自動的にできなくはない。ある固有名詞に対してWikipediaを引いてくるという処理をすればいいわけですから、そう遠くない未来にできると思います。知識に関する表現は、インターネット上にその事項についての説明が存在するので、自動的に探して補足的に付け加えることが可能です。文学の翻訳は歴史的なコンテキストや社会的な状況を含めて考えなければならないのでそう簡単ではありません。アメリカの映画でテキサスの石油王のしゃべり言葉を字幕では東北弁で訳していました。アメリカにおけるテキサスという田舎のイメージや位置づけを日本に置き換えたときに、それを日本のどの土地に当てはめるかという作業はなかなか自動でできるものではありません。

秋山 「古池やかわず飛び込む水の音」の英語の翻訳例なども、日本語にない主語をどう表現するか、ということや、余韻や言外の意味をどう伝えるかが難しそうですね。

永田 俳句を詠んでいる状況全体を考えて、言葉が置かれている周辺の文脈を全部移し替えなくてはなりません。

秋山 でも機械なら際限なく試行錯誤することが可能ですし、膨大なデータを読み込ませて出力された訳で近いものに点数をつけて学習させれば、できるような気がするのですが。

永田 近似値のようなものは得られますね。

秋山 SFでよくある、コンピューター同士が勝手にやりとりをするうちに、人間が持つような言語を作りだしてしまうとか、人間の分からない高度な会話をするということはありうるのでしょうか。

永田 通信プロトコルとして高度なやりとりをすることはありえますが、人間が話す言語と同じようなものという形にはならないのではないか。たとえば、厳密にルールが決まっているチェスや囲碁や将棋などは対戦型でいくらでも賢くなりますが、言語でお互いに会話をすると賢くなるかというとそこまで賢くならないですね。

秋山 かれら(コンピューター)が勝手にやることは、かれらの都合で人間の必要性からは離れていくでしょうから、人間から見て使えるかという視点で見れば使えないという可能性もありますよね。

永田 チャットボットのような対話するコンピューターは賢いので、人間並みと言われるのですが、二往復か三往復すると、だんだん破綻してきます。ご出身はと聞いて、奈良ですと答え、しばらくしてどこで生まれたんですかと聞くと、大阪です、と返してきたりする。人格のような一貫性がなく、背景に大量のテキストデータがあってそこからもって来て、反射的に応答しているだけなので。