福本伸行「賭博覇王伝 零」における最適戦略の存在

さて、まず始めにこの手の問題の常套手段であるモデル化をしよう。鉄板を四枚使って指一本をリスクに晒したとき、狙われる確率は等しく\frac{1}{5}であるとして、駆け引きや読み合い、晒す指による狙われやすさは考慮せず、確率モデルにしていこう。(数学というのはそういうものです)。
以下、Aを先攻、Bを後攻、P(A)をAが勝つ確率、P(B)をBが勝つ確率と表記する。そして、Aの取れる戦略をA=\{a_1,a_2.a_3\}、Bの取れる戦略をB=\{b_1,b_2b_3\}とすると、a_i,b_j\in \mathbb{N},\quad 2\le a_i,b_j\le 5,\quad\textstyle\sum_{i=1}^3 a_i =\textstyle\sum_{j=1}^3 bj=12となる。それにしても、texがめんどくさいことこの上ない。
ここまで定義した上でP(A),\quad P(B)を表記してみよう。
P(A)=\frac{5-b_1}{5} + \frac{b_1 a_1(5-b_2)}{5^3} + \frac{b_1 a_1 b_2 a_2 (5-b_3)}{5^5}
P(B)=\frac{b_1 (5-a_1)}{5^2} + \frac{b_1 a_1 b_2 (5-a_2)}{5^4} + \frac{b_1 a_1 b_2 a_2 b_3 (5-a_3)}{5^6}
まずP(A)に注目してみよると、なんとP(A)にはa_3が現れてないのだ。よって、A=\{5,5,2\}P(A)を最大化する最適戦略ということになる。ちょっと考えればこれは当たり前のことで、3ターン目の防御の段まで来てしまったらもうAに勝ち目は無いのである。
次に、P(B)を考えてみよう。通分して分子のみに注目すると、5^4 b_1 (5-a_1) + 5^2 b_1 a_2 b_2 (5-a_2) + b_1 a_1 b_2 a_2 b_3 (5-a_3)となる。ここで、Aが最適戦略A=\{5,5,2\}を選ぶとすると、第一項と第二項は0になるので、第三項を最大化する組み合わせ、B=\{4,4,4\}がBの最適戦略となる。Aと比べたら当たり前で面白くない答えが出てしまった。
さて、ここでA、Bがそれぞれ勝つ確率が最も高い最適戦略をとったとすると、それぞれの確率はP(A)=\frac{61}{5^3} \quad P(B)=\frac{4^3 \cdot 3}{5^4}となっている。それぞれだいたい、0.488と0.282なので、常識的に考えるとおり、このゲームは先攻が圧倒的に有利に出来ているのだ。
もしこのゲームをやることになったらとにかく先攻を取るようにすればいいのだが、ぼくがこれからの人生でこんなキチ○イじみたギャンブルをやる確率というのは果たしてBが勝つ確率よりも高いのだろうか。常識的に考えて28%もあるとは思えない。
つまりは机上の空論なのだ(そしてそれこそが数学なのだ)。