大規模学習と人間による
フィードバックが生む「人間っぽさ」

 また、みなさんもその名前を一度は耳にしたことがあると思いますが、「深層学習(ディープラーニング)」手法では、複数の「層」で構成されたニューラルネットワークを用います(図3)。

図3:複数の層で構成されるニューラルネットワーク同書より転載

 人間の大脳皮質が複数の層を持っていて、その性質が開発のヒントになったとも言われています。大規模言語モデルも多数の層からなります。

 さらに、存在するテキストデータをもとに学習しただけだと、そのデータに含まれている明らかな誤りや偏見などが色濃く取り込まれてしまうため、人間がフィードバックを与えて応答を調整する学習もおこなわれます。これを「人間によるフィードバックに基づいた強化学習」と呼びます。

 例えば、ChatGPTに爆弾や生物兵器の作り方を聞いても、答えを出しませんが、それはこの調整によるものです。また、男女差別や人種差別などを肯定するような回答は出さないようになっています。ただし、生成AIの出力から完全に偏見が取り除かれているかと言えば、それもまた心許ないところです(これは、学習データを書いている人間が偏見を持っているのですから、仕方のないことです)。

 ともあれ、これらの過程を経て、ChatGPTのような、あたかも人間と話しているかのようなシステムが開発され、今世間を――良くも悪くも――騒がせているのです。

 さて、ChatGPTなどの生成AIを実際に使ってみると感じられると思いますが、たしかに生成AIの出力は「あたかも人間が話しているかのよう」ではあります。「もはや現代技術は、自然言語を生みだす生成AIを創り出した」といった意見まで聞かれるようになってきました。