

2022年FIFAワールドカップ日本招致構想
スマートデバイスを介して音声会話が瞬時に自動翻訳され、言葉の壁を乗り越えて多くの人がコミュニケーション可能になる。機能としては単純なことだが、この実現を多くの人が夢見てきたし、ワールドカップやオリンピックのような、世界中の人が集まる場所においては、必要不可欠な機能でもある。
要素技術は、すでに商用化されている。音声認識はスマートフォンを中心に日常のものとなりつつあるし、テキストデータを対象とした自動翻訳の性能も上がってきた。そして翻訳結果を音声合成することも、聞き取るだけであれば十分なレベルにある。それらを自然な形で統合する動きも、すでに始まっている。
より高度で自然な形でのサービス提供、たとえば文脈に依存した自然な解釈、人間の肉声に近い合成音声というところまで目指すなら、まだ開発の余地があるだろう。一方それらは、理論的な研究開発よりも、データの蓄積による精度向上といった、実践的な事業開発でこそ、磨かれるもの。
その意味で、すでに関心の対象は、商品としてのブラッシュアップ、すなわちサービスレベルの要求水準をどこに設定するか、に移っている。そしておそらくこのトレンドは今後ますます強化されてだろう。そして東京五輪では、災害発生時の誘導等を視野に入れると、期待どころか必要不可欠なものとして、位置付けられていくだろう。