Facebookの不思議な機能も
AIによるものだった!

岡田 これにフィードバックを加えると、さらに正確になります。コンピューターに犬とも猫とも教えずに犬の画像を何千枚も見せ、間違って「猫」と判断したものがあったら「いや、犬だよ」と教えてあげるのです。すると正答率が高まっていきます。犬や猫の画像だけでなく、イラストだって判断することができますよ。ちゃんと「これは犬」「これは猫」と教えていけば、その特徴を把握して「これ、犬じゃない?」と分かるようになるんです。

夏目 たしかに人間のようだ!でも、それって我々の生活でどう役立つんですか?  

岡田 例えばFacebookに友達と一緒に写った写真をアップしたら、コンピューターが友達の顔を認識して「〇〇さんじゃないですか?タグ付けしますか?」と表示されますよね。

夏目 あれ、何でだろうと思ってた!

岡田 あれもディープラーニングを使っています。ナツメさんがFacebookにあげた写真は分析され、目の形、鼻の形などの特徴量が把握されます。そして、ナツメさんの友人の誰かがナツメさんと一緒に写った写真をアップすると「おや、この人の写真のここに、こういう特徴がある。この画像のこの部分はナツメさんなんじゃないですか?」と表示されるんです。

夏目 へえー!でもたまに迷惑ですよね。締切前に酒を飲んでいたのを編集者にチクッてくれた恨みは忘れてませんよ。

岡田 (笑)。あとは音声認識です。スマホで音声検索ができますね。音は、言葉でも音楽でも、周波数という1本の波形で示されます。そこで「あ」なら「あ」の音の周波数を、コンピューターがディープラーニングで学習するわけです。

夏目 いろんな人の声や話し方の「特徴」を覚えてて、「“とうきょう”と言った」とか直感でわかるわけですね。

岡田 おっしゃる通りで、Googleは大量のユーザーに音声認識のアプリケーションを利用してもらうことで、より現実問題に即したデータを収集することができています。ディープラーニングするためのサンプルは膨大です。だからアナウンサーが話したような綺麗な発音の「とうきょう」や、方言のある方が急いでしゃべった「とうきょう」など、多くの特徴量を獲得しています。だから多くの方が話す「とうきょう」を認識できるんです。

 実は1970年代から「ニューラルネットワークを使えばディープラーニングが可能になる」と言われていました。しかし当時はコンピューターの性能が追いつかず「この膨大な処理を行うには数万年かかるよね」といった事態が頻発し、研究が下火になっていきました。しかし90年代からコンピューターの性能が爆発的にあがって、再び注目されたんです。

夏目 だから、前回の記事でおっしゃっていたように「経験の蓄積ができ」「コンピューターに人間らしい“直感”が備わった」というわけですね。ところでこれ、産業で役に立ったりするんですか?

岡田 もちろんです。だから、今回のAIブームは一過性のブームでは終わらないんです。