「アルファゼロ」は、人間の考え方がいっさい入っていないAIなんです。これまでのソフトは過去の人間の膨大な棋譜(※)をビッグデータとして読み込ませることでつくられてきました。しかしアルファゼロでは、基本的なルールを教えただけで、人間の棋譜や指し手はまったく教えていません。そのうえで、ひたすら自己対局を繰り返して、勝つ可能性の高い手を自力で学んでいきます。つまり、AI自身によってゲームが展開されているのです。だから、発想が人間とまったく異なってくることは当然です(※対局時における棋士の指し手の記録)。
AIは先の流れを読んで指すようなことはありません。その局面での評価点によって、最高の手を指してきます。そのため、人間的な発想で「ここでのポイントは低いけれど、何手か先に進めばよい展開になる」という手が、マイナス評価を下されてしまうこともあります。
AIの登場によって、将棋の定跡も変化してきました。専門的な話ですが、将棋には「角換わり」という戦法があって、この場合、木村定跡と呼ばれる「先手は5八金、後手は5二金」の形が15年ほど前までは定跡でした。ところが、最近では「先手は4八金、後手は6二金」の形が定跡になってきました。また、「振り飛車」は有名な戦法の一つですが、AIは現在の局面で形勢判断するので、飛車を振った瞬間にマイナス200点ぐらいの評価を下したりします。
人間が指す将棋では、長年の経験値があるので、こういう局面ならこう指したいという感情や癖が表れるものです。けれども、AIはそうした感情がないので、普通なら絶対に指さないような手でも、平気で指してきます。
また、人間の棋士は「持久戦に持ち込もう」とか、「どんどん攻めていこう」など、その日、その時の展開のなかで戦略を考えるのですが、現状の将棋ソフトは先ほどお話しした通り、その局面に限定した最善の一手を指してきます。一手ごとにリセットし、相手の出方に応じて、また次の局面で最善の一手を選んでくるわけです。
つまり、将棋における「流れ」はAIには関係ないということです。一手と一手の間につながりはありません。だから棋譜を見ると一貫性がなく、美しくないと感じることもあります。
――AIが登場するまでは、プロ棋士はどのように将棋を学んできたのでしょうか。