米グーグルの囲碁AI「アルファ碁」が人類最強棋士に勝利してから約半年。さらに二つの成果が発表された。人間のデータを学習に使わない「アルファ碁ゼロ」と、碁以外にも汎用化した「アルファゼロ」だ。AIが急速に進化していく中で、人類とAIはどう向き合っていくべきなのか。囲碁AIの現状を、大橋拓文六段が描く。
二つの衝撃的な論文で分かった
アルファ碁の急速な進化
米グーグル傘下のディープマインドが開発した囲碁AI「アルファ碁」の進歩には、心の準備をしていても驚かされる。10月と12月には、衝撃的な二つの論文が立て続けに発表された。
まず10月に発表されたのは、アルファ碁の新バージョン「アルファ碁ゼロ」である。最初に囲碁のルールをプログラムした後は、人間の棋譜を与えずに、自分自身との対戦による強化学習だけで、従来版のアルファ碁の強さを超えたのだ。
そして12月に発表された「アルファゼロ」。アルファ碁ゼロに改良を加え、汎用化された。名前から「碁」の文字がなくなったことからも察せられるように、囲碁だけでなく他のゲームもプレイできるようになった。そして2時間の学習で最強の将棋AIに、4時間で最強のチェスAIに、そして8時間で2016年版のアルファ碁に勝つまでになった。