普段、我々が話す時、完成された一文を頭に浮かべてそれをきっちり発表するように話すわけではない。慣例や反射で飛び出す一文は除いて、だいたいは話しながら超高速で言葉を選んで文を構築していっている。
言葉が構築されていくフローには「よくある言い回し」など、日本語に精通した人が共通して持っている経験則が参考に用いられる。これをAIもやるようになったわけである。
先に例に挙げたデモムービーでの日本語「それでは早速当社の」を聞いただけで、英語「Let's jump right into」(意:「早速○○を始めましょう」)が生成されたわけは、実はその前に発言者の「突然のお願いにもかかわらずお集まり頂きありがとうございます」という発言があった。
「どうやら会議のようなものが始まりそうだ」という文脈をAIは汲んで、さらに「会議なら何か議題を提示するところからスタートするだろう」と予測し、話の途中で上の訳文を生成するに至ったわけである。
同時通訳に関しては現在DeepLがまた一歩リードしているような状況だが、AIの分野は日進月歩だから各社も近いクオリティにまで水準を揃えてくるかもしれない。
日常でちょっと翻訳を使う人には
現状のクオリティでもOK?
しかしDeepLがビジネスの場に主に注力して研究開発を進めているのに対し、Google翻訳はその分野に関してそこまでの熱意を注いでいないようにも見える。
ユーザー層を考えてみると納得だが、裾野が途方もなく広いGoogleの、その翻訳を使うなら「ビジネスにおけるガチの翻訳」を求める人より「日常の中でのちょっと使い」の人の方が多そうである。
「ちょっと使い」に、多言語間でのビジネスミーティングのようなリアルタイムさは求められておらず、むしろ少し時間がかかってもいいから翻訳の同時性よりは正確性が求められる。
たとえば日本に旅行に来た外国人とGoogle翻訳を介してコミュニケーションをするとき――とか、なんでもいいのだが、日常会話レベルのやり取りは現行のGoogle翻訳で、少なくとも現代人の感性には充分なのである。
「話す→アプリが音声を拾って外国語を訳出→相手がそれを見る・聞く」というターン制のラリーは、DeepLがやろうとしている同時通訳ほどのスピード感は言うまでもない。
しかし、「いちいちワンテンポ待って」「外国語の相手と少し苦労して意思疎通を図る」体験は趣きがあっていいものだし、その不自由さを許容する構えが、2025年の現代人には備わっているから、Google翻訳は今の成長曲線で特に問題なさそうである(無論、瞬間的な同時通訳が将来主流になっていくならそのワンテンポを待てる感性はなくなっていくであろう)。
翻訳サービスを手掛ける企業によって最適解がそれぞれ違うので開発の方向性も違う、ということである。
ともあれ、ストリーミング翻訳のような即時瞬間的な翻訳をAIが可能にすれば、国際社会はさらに活発になるであろうことが期待される。
一方、そうした技術の普及によって通訳の際にニュアンスがこぼれ落ちて意思を100%伝えきれず相手に誤解を与えるリスクが増したり、外国語を学習する意欲が低下したり、言語を取り巻く文化にもいくばくかの変容がもたらされることが予想される。
このあたりの技術革新と懸念のせめぎ合いは、AIが登場して以降各分野に必ずつきまとっているものではある。
「同時通訳」技術の進展に注目していきたい。







