つれづれギャモン日記

バックギャモンに関する日記です。面白いポジションや大会、例会の結果などを徒然と書いていきます。

パラドックス(解答)

2013-01-28 12:14:54 | 日記
前回のパラドックス問題を出してからだいぶ日が経過したので、そろそろ答えを発表します。
では問題文のどこが間違えていたかというと、この箇所です。

「仮にx%落とすとしましょう。すると解析によれば、Cさんが勝つ時は(50+x)%のLuckを得て、コンピュータが勝つ時は(50ーx)%のLuckを得ます。」

この部分が誤りです。コンピュータの評価器がもし厳密に誤差がなければ(エラーによる勝率変動の総和)と(Luckによる勝率変動の総和)の合計は50%に必ずなります。ところが、実際にはコンピュータは正確でないためにぴったり50%に一致しません。

なぜこの現象が起きるかというと、2Plyや1Plyなど何手先読みかでコンピュータの返す評価値が変わるからです。以下具体的に説明します。


仮に全体の解析を2Plyでやるとします。あるポジションAにおけるダイスのLuckは(ロールする前のAにおける2Plyの評価)と(ロール後のAにおける1Plyの評価)の差分として計算されます。
ロール後に正しくチェッカープレイがされたとして、次のポジションをBとしましょう。BにおけるダイスのLuckも同様に(ロールする前のBにおける2Plyの評価)と(ロール後のBにおける1Plyの評価)の差で求まります。

さてここで問題が生じます。理論的にはチェッカーエラーがなければ、ロール後のAの期待値とロール前のBの期待値は一致します。ところが前者は1Plyで評価されるのに対し、後者は2Plyで評価されるので解析では一致しません。

この不一致が原因で、Luckを足していっても連続するLuckとLuckの間に隙間があるために勝率変動の総和がぴったり50%にならないわけです。


このことはお手持ちのXGやGNUBGでも確かめられます。

この現象はロールの前後で同じ評価器を使えば解決できるのですが、すると今度はLuckの期待値が0にならない問題があります。 Luckの解析はボットやオンラインサーバー等でダイスにイカサマがないことを調べる目的にも使われるので、仕方なく期待値0を優先したのだと思います。


さてここまで偉そうに解説してきたわけですが、自分はこの問題を自分で考えておきながら3時間以上悩んでしまいました。 皆さんはすぐにわかりましたか?