AIは、人が2万年かかる自己対戦で
腕を磨いてプロ棋士に勝った!

「AIの自己分割」というと、有名な逸話があります。
 それは、世間の耳目を集めた佐藤天彦(あまひこ)名人とAIの「ポナンザ」による2017年の第二期電王戦です。

 棋士として最高位に君臨する佐藤名人と、プロ棋士相手に2年間無敗の「ポナンザ」との二番勝負でしたが、結果は「ポナンザ」が2勝と圧勝したことをご記憶の人も多いでしょう。

 酷な話ですが、私たち人間は、もはや将棋の世界ではAIに到底太刀打ちできない現実を目の当たりにしたわけです。

 そして、このときに「ポナンザ」が用いていた学習方法が「自己分割」でした。
「ポナンザ」は、自らを二分割して自分自身と戦う「自己対戦」を700万局もこなして、人がまだ発見できていない未知の手を次々に習得していったのです。

 この700万局とは、もし人が休むことなく毎日1局対戦し続けたとしても2万年かかる局数であり、羽生善治永世七冠はポナンザのこの自己対戦を「シャベルとかスコップとかで掘っていたのが、急にブルドーザーで一気に開拓していくような感じがある」と評しています。

 囲碁に目を向けても、すでに2016年にGoogleの「アルファ碁」(AlphaGo)が、イ・セドル九段を破っています。
 諸説ありますが、囲碁の歴史は2000年ともいわれる中で、AIはわずか数年の学習で人類の叡智を超えてしまったのです。

 この「アルファ碁」は、当初は人が考えた定石を入力して教育していました。ところが、試しに定石を教えずに完全に自己学習をさせたところ、「定石を教えた場合よりも早く」「定石を教えた場合よりも強い」AIが誕生したという話もあり、そうなるとこれはもはや、AIにとっては人類の叡智すら逆に足かせになるほどの独自の学習理論を獲得した証左ということになります。
 実際に、人は今なお「なぜ、『アルファ碁』はあの局面であの手を打ったのか」が証明できずにいます。