自動車の無人運転や嘘発見器などに
応用が期待される「動画認識」

 もっとも、単語が読み取れるのと、「会話ができる」のでは雲泥の差があります。
 そうした意味では、確かにAIが読唇術で人間のプロを打ち負かしたことには驚愕せざるをえませんが、まだまだ実用化には時間がかかると思われます。

 ちなみに、2017年には、ポーカーで人間を破るAIまで登場し、「すでに嘘発見器程度の精度は出せる」とする専門家もいますが、そのAIが本当に人間の表情を読み取って勝利したのかは定かではなく、この結果をもってAIの動画認識を過大評価するのは危険だと個人的には感じます。

 ただし、こうした動画認識のテクノロジーは、間違いなく今この瞬間も進化しており、ゆくゆくは自動車の無人運転の基幹技術になったり、AIが嘘発見器になる時代が訪れるでしょう。

 また、現在、「Siri」や「OK, Google」といった音声認識ソフトを活用している人もいると思いますが、みんながみんな、スマホに向かってつぶやいている世の中はあまり想像したくないというのが私の本音です。

 しかし、スマホのカメラで読唇術ができるとなると、状況は大きく変わってきます。無音でスマホに語りかけて、その回答はイヤホンで聴く。そんな時代がやって来るのかもしれません。

 いずれにしても、2012年の「Googleの猫」も画期的でしたが、AIに唇の動きや表情を読み取られてしまう世界がすぐそこまで来ています。
 そして、AIの「動画認識」のテクノロジーが本当に人類の幸せに寄与するのかどうか。
 今後もこの分野の研究からは目が離せませんね。

 さて、このAIの動画認識ですが、これは「ディープラーニング」というAIの自己学習の技術です。その中でも、とりわけ「強化学習」の成果と言えるものです。
 そのディープラーニングをするAIを「子どものAI」と呼びます。
 一方で、人が一から教えて丸暗記させるAIは「大人のAI」と呼びます。
 同じAIといえども、両者でどれほどの違いが出るのかは、第1回連載の中で「子どものAI」である「Google翻訳」と、「大人のAI」である別の翻訳サービス(X翻訳)に同じ英文を日本語に翻訳させて、まったく異なる結果になるケースを紹介しています。現在一番人気の第2回連載近い将来、『税理士や翻訳家は失業』という予想は大間違い」と併せてお読みいただけたら、望外の喜びです。