しかし、答えはある。私たちは相手に悟られないよう、でたらめにグー、チョキ、パーを出しているはずだ。この通りにグー、チョキ、パーを、ランダムに3分の1の確率とするのが、解なのである。
こうしたゲームでは、一つの戦略を確実に選ぶ(純粋戦略)のではなく、戦略を確率的に選ぶと考える。これを「混合戦略」と呼ぶ。
ゲーム理論の創始者にして、コンピューターの父とされる数学者、フォン・ノイマンらがまず目を向けたのは、この考えだった。
サッカーのペナルティーキック(PK)戦もしかりだ。右に蹴るのが得意なキッカーに対しては、キーパーはボールが右に来そうだと読む。キーパーが右と読むなら、キッカーは逆の左に蹴りたい。お互いにこの状態がいいという定まったものがないのだ。
こうした混合戦略の計算過程はここでは省くが、右に蹴るのが得意なキッカーは、「キッカーが7分の3の確率で右へ、7分の4の確率で左へ蹴る」「キーパーが7分の6の確率で相手から見て右へ、7分の1の確率で相手から見て左へ跳ぶ」がナッシュ均衡となる。
キッカーにとっては、不得意な左へ蹴る確率を高くするというのが、このゲームの答えだ。
囚人のジレンマの裏切りを
協力に変えられるか
戦略形ゲームには、他にも大切な切り口がある。繰り返しだ。
囚人のジレンマ、チキンゲーム、コーディネーションゲームなどは、いずれもプレーヤーが同時に1回だけ行うゲームだった。
しかし、現実には1回きりでなく、同じゲームが何度も繰り返されることが多い。国家間の貿易戦争にしろ、企業同士の価格競争にしろ、長期にわたって何度も直面する問題だ。こうしたゲームは「繰り返しゲーム」と呼ばれる。
「囚人のジレンマ」が何回も繰り返されるゲームを考えてみよう。