人間のトポロジー写真はイメージです Photo:PIXTA

AIの主要な技術は、脳の神経細胞ネットワークをプログラム上で模したモデルが基盤。最近の生成モデルがつくり出す顔は、本物と言われても疑うことがないぐらい技術が進歩している。最新の画像生成AIに使われている技術を紹介しよう。本稿は、中野珠実『顔に取り憑かれた脳』(講談社現代新書)の一部を抜粋・編集したものです。

ネットに投稿された
偽物のゼレンスキー

 2022年2月24日、ロシアによるウクライナへの軍事侵攻は世界中に大きな衝撃を与えました。連日、戦闘の様子などの報道が続いていますが、実は今回の戦いは最新の情報技術を用いた激しい情報戦という側面もあります。

 その一端が垣間見えたのが、同年3月16日にインターネット上にあげられた偽動画です。それはウクライナのゼレンスキー大統領が登場し、ウクライナ軍に武器を置くよう呼びかけるという内容でした。すぐに大統領本人がそれを否定する動画を投稿し、FacebookやYouTubeも即座に動画を削除しましたが、このような偽動画が戦争の武器となりうる現実が浮き彫りになる出来事でした。

 この際、報道では「ディープフェイク」という言葉が使用されていましたが、これは人工知能(AI)の一つである深層学習(ディープラーニング)を利用して本物のように見せかける技術のことです。動画中の顔を差し替えたり、言葉に合わせて口を動かしたり表情を変えたりと、本人が話しているのと区別がつかないレベルにまで技術が急成長しています。この技術を使えば、例えばテレビのニュースキャスターが毎回ニュースを読まなくてもよくなったり、AIによって合成されたバーチャルタレントをつくれるようになったりするため、エンターテインメント分野での活用が期待されています。

 実はAIの主要な技術であるニューラルネットワークや、それを何層にも重ねたディープラーニングは、脳の神経細胞ネットワークをプログラム上で模したモデルが基盤となっています。学問的にも「脳」と「情報科学」は結びつきが強く、こうしたテーマは人間の脳が顔を認識するメカニズムを理解するうえでも、重要な手がかりを与えてくれるかもしれないのです。

AIが顔を生成する仕組みは
脳が顔を認識する働きに似ている

 顔を認識する脳の専門領域には、顔のさまざまな特徴に対して特異的に反応する神経細胞が集まっています。そして、それぞれの神経細胞の活動量に応じて、それが表現している顔の特徴を合計していくと、見ている顔とそっくりの顔を再現できました。大まかに言ってしまうと、AIが顔を生成するときも、同じようなことをしています。顔の特徴を膨大な数の変数で捉え、その変数の値の組み合わせで顔の情報を表現しているのです。擬似的なデータをつくり出すことを「生成」と言い、それを実現するモデルのことを「生成モデル」と呼びます。この生成モデルは、変数が多ければ多いほど、より精度が上がることがわかってきました。