これは前回の記事で使った分析結果です。2020年の東京都知事選の22人の候補者の得票数について、東京都の62の市区町村単位で調べます。作業としてはその地域での得票数の上一桁の数字を調査します。小池百合子候補(当時、以下同じ)の千代田区での得票数は1万6727票ですから上一桁は「1」、山本太郎候補の中央区での得票数は7769票ですから上一桁は「7」ということになります。

投票に不正があると乱れる
統計上の「自然の調和率」

 この上一桁の数字がどう分布するかというと、ちょっと意外かもしれませんが、「1」が一番多くて全体の30%を占めることが知られています。「2」が次に多くて18%、「3」が3番目に多くて全体の13%になることが、統計学的にわかっているのです。これがベンフォードの法則です。

「そんなバカな。ランダムに数字が分布すれば、1から9まで同じ確率で並ぶはずだろう」

 と普通は思うのですが、統計学的にはそうならない。山本太郎候補の利島村での7票から小池百合子候補の世田谷区の23万票まで、ケタ数が1ケタから6ケタまで広く分布する場合、上一桁は同じ確率ではなく対数に従って分布するのです。

 実際に比較してみましょう。2020年の東京都知事選でも、2017年の衆議院議員選挙の東京小選挙区でも、それぞれの自治体での得票数の上一桁を集計すると、ほぼ見事なくらいその結果はベンフォードの法則での出現確率と同じ分布になります。

 しかし、この投票に不正が働くと、この見事な自然の調和率が壊れるそうです。