つれづれギャモン日記

バックギャモンに関する日記です。面白いポジションや大会、例会の結果などを徒然と書いていきます。

クローズアウト対プライム戦における勝率の見積もり方 その3

2013-01-12 11:44:25 | プライム戦

「クローズアウト対プライム戦における勝率の見積もり方」 の記事も今回で3回目となりました。

そろそろ飽きてきた方もいるでしょうが、どうぞ最後までお付き合いください(本当にもう読みたくなければウィンドウ上部の×印のボタンを押せばいつでもやめることができます)

 

前回までで勝率の推定法の説明は一通り終わりましたが、実はその方法を直接当てはめると誤差が生じるケースがあり、補正が必要になります。今回はその補正方法について説明します。

まずどういう場合補正が必要なのか、結論から言いますと

1.相手が1マンオンザバーで今にも自陣がクラッシュしそうなとき

2.余ったチェッカーのタイミングに十分余裕があるとき

の2つの場合です。では1つ目のケースについて例を挙げます。

 

ポジションD マネーゲーム

 

黒が1枚オンザバー、白は1枚プライムに捕まっています。 

今までのポジションと違い、次に悪い目を振るとすぐに白の陣形が崩れそうです。

前回までの方法で勝率を見積もると

33+7-24+0+50=66% 

となります。ロールアウトの結果と比較すると

 

Analyzed in Rollout
Double/Take
Player Winning Chances: 63.97% (G:1.64% B:0.02%)
Opponent Winning Chances: 36.03% (G:1.96% B:0.05%)

 

白の勝率は約64%であり、推定値より2%勝率が下がっています。白は12通りの悪い目を振ると6ポイントが崩れて途端に不利になってしまうのですが、前回までの見積もりではその影響を加味していなかったのでこれだけの誤差が生じます。

 

ポジションE マネーゲーム

 

さらにチェッカーを前進させてみました。 ここまでくると6を含まない25通りのすべての目で白陣が崩れてしまいます。推定値では60%の勝率となりますが、ロールアウトによると

 

Analyzed in Rollout
No double
Player Winning Chances: 54.74% (G:1.38% B:0.01%)
Opponent Winning Chances: 45.26% (G:2.64% B:0.06%)

 

このように5%強も誤差が生じています。陣地を崩す目が12通りで2%、25通りで5%、なのできれいな正比例の関係とは言えないまでもだいたい比例すると考えてよいでしょう。ここはおおまかに

補正値[%] = -(陣地を崩す目の数)/5 

として補正することにします。

 

※なおこの補正は黒がオンザバーに1枚いる場合に必要です。オンザバーに2枚いるときは白陣が崩れてもすぐには不利にならないので、補正は必要ありません。

 

ポジションF マネー

 

 今度は5プラに2枚捕まっています。345のぞろ目を振ると6Pが崩れてしまい、黒からのキューブを受けることができません。自陣が崩れたときのダメージが大きいため、崩れる目はたった3通りでも大きな誤差が生じます。

白の勝率の推定値は

33+11-38+50=56%となりますがロールアウトの結果では53.45%となっています。

 

Analyzed in Rollout
No double
Player Winning Chances: 53.45% (G:1.49% B:0.03%)
Opponent Winning Chances: 46.55% (G:7.79% B:0.24%) 

 

12Pのチェッカーを動かしてみて補正値の求め方を考えてみたのですが、いい方法は見つかりませんでした。。うーん残念。1Pまで動かすと適切な補正値は約 -9%となります。3通りで崩れて-3%、25通りで崩れて-9% なのですからもはや単純な数式では表現できないようです。幸いこのようなポジションでキューブアクションを考えることは、特殊なマッチスコアじゃなければないでしょうから、実戦で困ることはあまりなさそうです。

 

次に十分タイミングに余裕がある場合です

ポジションG マネー

 

今度はタイミングにたっぷりと余裕があります。白の勝率を見積もると

33+34-24+6+50=99% となります。

・・・そんなわけないですね。 一応100%を超えてなかっただけマシでしょうか。

ロールアウトによると白は88.4%の勝率があります。

 

Analyzed in Rollout
No double
Player Winning Chances: 88.41% (G:37.66% B:0.97%)
Opponent Winning Chances: 11.59% (G:0.49% B:0.01%)

 

無責任なようですが、この場合も正確な補正値を得る方法は見つかりませんでした。。

ただ相手が1マンオンザーのときは明らかにキャッシュですし、2メンオンザバーのときはギャモントライですからキューブアクションに悩むことは通常ないと思います。

え?スコアで大量リードしていて4倍リダブルを返すときはどうするか? そんなの知りませんww

 

結論:公式に頼ることなく自分の直感とフィーリングを信じましょう

 

なんだか勝率の見積もり法を提案しておきながらすごい矛盾していますが、これって強くなる上で大事なことだと思っています。僕は数学的に扱える分野、レースセオリーやスコア特性、またこういう単純なプライム戦を考えるのが好きなのですが、実際のバックギャモンではもっと複雑な局面がたくさんあり、そういうところで実力差が大きく出ます。

そういう点に本来最も力を入れて勉強すべきなのですが、しかし数学的なセオリーを考えることにハマりだすと必要以上に時間を費やしてしまう癖があります。あまりこういうセオリー作りに陥らないよう気をつけたいと思います。

 

さてクローズアウト対プライム戦の記事はいったんここで打ち切りますが、そのうちまた補足で記事を書く予定です。いまのところ、「ギャモン率の推定法とキューブアクション」、「黒の5プラを動かした場合などの変化形」を書こうと考えています。また投げ出してしまった補正法に関しても上手いやり方が見つかったら追加するかもしれません。

 

ここまでお付き合いいただきありがとうございました。わかりにくい表現が多かったかもしれません。

質問やご指摘がありましたらコメント欄にお願いします。

 

なおロールアウトの設定は以下のとおりです。

Rollout:
2592 Games rolled with Variance Reduction.
Dice Seed: 36860815
Moves: 2-ply, cube decisions: 3-ply Red

eXtreme Gammon Version: 2.03


クローズアウト対プライム戦における勝率の見積もり方 その2

2013-01-06 18:22:53 | プライム戦

勝率の見積もり方は

勝率 = 33 + (タイミングのピップ数) - (プライム脱出に必要な平均ピップ数) + (オンザバーの枚数によるボーナス) + 50 +(補正)

このように単純な足し引きで求められることまでを前回話しました。では具体的にどうやって求めるかを以下のポジションを例に説明します。

 

ポジション A(再掲)

(1)タイミングのピップ数。クローズアウトに必要なチェッカーや5プラに捕まっているチェッカー以外のチェッカー(ポジションAでは6Pと17Pにあたる)が1Pまでに何ピップ余裕があるか、そのピップ数の総和を取ったものです。すなわち上の例では(6-1) + (17-1) = 21 となります。

 

(2)プライム脱出に必要な平均ピップ数。これは5プラに捕まっているチェッカーを逃しきるのに要するロール数をピップに換算した値のことです。 おおざっぱですが一回ロールして6が出る確率は約1/3で、一回のロールで進む平均ピップ数は約8ピップです。6を出して5プラを脱出するためには期待値的に3ロール必要で、これをピップ数に換算すると3×8=24 ピップとなります。 

 

(3)オンザバーの枚数によるボーナス。相手のチェッカーがバーに1枚あるときは0、2枚あるときは6となります。3枚あるときはやや不正確になりますが9ぐらいになります。ポジションAの例では1枚なので0となります。

 

(4)補正。ポジションAは補正が特に必要ない形です。どういう場合に必要かは次回述べます。

 

 

 では公式に当てはめますと

 勝率 = 33 + (タイミングのピップ数) - (プライム脱出に必要な平均ピップ数) + (オンザバーの枚数によるボーナス) + 50 +(補正)

代入して

33 + 21 - 24 + 0 + 50 + 0 = 80% が得られます。したがってマネーゲームで黒がここでキューブを打てば白はパスします。

XG2によるロールアウトの結果とキューブアクションは以下のとおりです。ぴったりと一致しました。

 

Analyzed in Rollout
No double
Player Winning Chances: 80.08% (G:2.23% B:0.03%)
Opponent Winning Chances: 19.92% (G:1.14% B:0.03%)
Double/Take
Player Winning Chances: 80.19% (G:2.15% B:0.03%)
Opponent Winning Chances: 19.81% (G:1.14% B:0.03%)

Cubeless Equities: No Double=+0.613, Double=+1.228

Cubeful Equities:
No double: +0.842 (-0.158)
Double/Take: +1.119 (+0.119)
Double/Pass: +1.000

Best Cube action: Double / Pass

Rollout:
5184 Games rolled with Variance Reduction.
Dice Seed: 93543280
Moves: 2-ply, cube decisions: 3-ply Red

eXtreme Gammon Version: 2.03

 

 

ポジションC

 

次の例は相手のチェッカーが2枚あり、自分のチェッカーが2枚捕まっている場合です。

タイミングのピップ数は12。オンザバーの枚数によるボーナスは6です。

プライム脱出に必要な平均ピップ数については少し工夫が要ります。1枚捕まっている場合は24ピップなので単純に2倍して48ピップとなりそうなところですが、実は1枚目のチェッカーを逃すことでタイミングのピップ数が新たに増えることを考慮する必要があります。つまり1回6を振って1枚抜け出すと17ピップの余裕が新たに得られます。この影響を頭で計算することは困難なので、ロールアウトの結果とつじつまが合うように値を求めました。この値が48から10引いた38となります。 ピップのタイミングに10加えても解釈が異なるだけで同じ結果が得られます。

式に代入すると

33 + 12 - 38 + 6 + 50 =  63% が得られました。 XG2によるロールアウトの結果とほぼ一致します。

 

Analyzed in Rollout
No double
Player Winning Chances: 63.02% (G:21.91% B:0.51%)
Opponent Winning Chances: 36.98% (G:7.58% B:0.27%)
Double/Take
Player Winning Chances: 63.33% (G:21.42% B:0.49%)
Opponent Winning Chances: 36.67% (G:7.63% B:0.27%)

Cubeless Equities: No Double=+0.406, Double=+0.813

Cubeful Equities:
No double: +0.394 (-0.167)
Double/Take: +0.561
Double/Pass: +1.000 (+0.439)

Best Cube action: Double / Take

Rollout:
5184 Games rolled with Variance Reduction.
Dice Seed: 57982384
Moves: 2-ply, cube decisions: 3-ply Red

eXtreme Gammon Version: 2.03

 

 なんだか一致しすぎていてかえって胡散臭いのですが、だいたい±0.5%の範囲内に誤差が収まります。

ただしいくつか例外的に誤差が大きくなりポジションがあり、その場合補正が必要になります。その方法についてはまた次回ということで。 

 

つづく…

 

 


クローズアウト対プライム戦における勝率の見積もり方 その1

2013-01-02 09:53:29 | プライム戦

このようなポジションでキューブアクションに悩んだことはあるでしょうか。

 

こういうポジションをリファレンスポジションなしに勝率を概算することは難しいと思います。だいたいのプレイヤーはダブルの境界線、テイク/パスの境界線となるポジションを暗記して判断していると思います。

ところがこの手のポジションはやり方さえ覚えてしまえば相当正確に勝率を見積もることができます。生涯賃金の関係で今まで秘密にしていたのですが、邪な考えを捨て公開したいと思います。

 

ポジションの定義

1.自陣のインナーがクローズアウトしており、相手の駒が1枚か2枚オンザバーにいる

2.相手陣が2Pから7Pまで5プライムができている

3.自分のチェッカーが1枚か2枚、相手の5プラに捕まっている

4.自分の他のチェッカーの場所は任意

5.相手の他のチェッカーは5プラの上にきれいに(1Pに多くて3枚)配置されている

 

基本的な考え方

下記のポジションA、Bを比較してみます

ポジションA  白の勝率80.08%

 

ポジションB  白の勝率77.37%

 

アウターにいるチェッカーを17Pから14Pに3ピップずらした以外は全く同じです。24Pのチェッカーが脱出するためには6の目を1回出せば良いのですが、6を出す前に5以下の大きい目を振ると白の陣地がクラッシュするためタイミングの余裕があるほど勝率が上がります。アウターのチェッカーが3ピップ前進することで勝率が約3%減少しており、このことからタイミングが1ピップ減ると1%勝率が下がる、と推測することができます。

このことに気づけば計算方法を導くことは難しくありません。

 

計算方法

単純な足し算だけで勝率を見積もることができます。その公式は

33 + (タイミングのピップ数) - (プライム脱出に必要な平均ピップ数) + (オンザバーの枚数によるボーナス) + 50 +(補正)

となっています。

33ってどこから来たの? 33と50を最初から足せばいいじゃん、という声が聞こえてきそうですが、これは僕の一種の美学なのでつっこまないでください。33のほうがぞろ目で覚えやすいです。

つづく・・・

 

 ※(訂正)最後の公式中、二つ目の記号を+から-に直しました

 

 


今日のポジション2012/12/30

2012-12-29 19:13:21 | プライム戦

白21 スコア4-0/7

 

GridGammonで現れたポジションです。白が21を振ったところでスコアは4-0/7です。

どう動かしますか?回答はコメント欄に載せることにします。 

 

 

さてその他反省すべきポジション。

白52 スコア 0-0/9

 

9ポイントマッチの0-0。白が52を振ったところです。少考して20/13を選択したら約0.200のブランダーでした。XGによれば6/4、6/1がベストとのこと。ピップが大差ないから今リスクを侵して外す必要がない、ということでしょうか。

アンカーを外すタイミングがいまいちよくわかっていないのでKit Woolsey氏の記事「Breaking the Anchor」を読んで勉強することにします。

 

 


今日のポジション2012/12/22

2012-12-22 10:45:26 | プライム戦

 

先日GridGammonでプレイしていた時おもしろいポジションがありました。

白が62を振ったところでスコアは1-0/7Pです。どう動かしますか?

 

 

 

 

 

実戦で僕は無造作に22Pを重ねたあと16/10と動かしたのですが、大ブランダーでした。

XG(extream Gammon)によると最善手は22/14で僕の実戦のプレイは0.191も期待値を下げています。

24Pを外すことによって相手の4、5が良い目なってしまうことが原因のようです。24Pに打ち込まれてダンスしているうちにバックマンが逃げ出される展開が十分ありえ、ロールアウトの結果によるとギャモン負け率が高くなっています。

XG推奨の22/14とプレイすると逆に15、33、35で相手のバーが崩れますし、14、24も相手の死に駒を作らせます。

 

 

 

以下ロールアウトの結果です。

 

XGID=aa-ABBB-B----B--A-bcccAbB-:0:0:1:62:1:0:0:7:10

1. Rollout¹ 22/14 eq:+0.055
Player: 55.65% (G:13.29% B:0.76%)
Opponent: 44.35% (G:23.39% B:3.98%)
Confidence: ±0.017 (+0.038..+0.072) - [96.9%]
Duration: 1 minute 06 seconds

2. Rollout¹ 22/16 13/11 eq:+0.032 (-0.023)
Player: 55.02% (G:13.23% B:0.67%)
Opponent: 44.98% (G:23.79% B:4.10%)
Confidence: ±0.017 (+0.014..+0.049) - [3.1%]
Duration: 1 minute 03 seconds

3. Rollout¹ 22/16 3/1* eq:-0.127 (-0.182)
Player: 50.53% (G:11.93% B:0.51%)
Opponent: 49.47% (G:23.32% B:3.36%)
Confidence: ±0.017 (-0.143..-0.110) - [0.0%]
Duration: 1 minute 09 seconds

4. Rollout¹ 24/22 16/10 eq:-0.136 (-0.191)
Player: 52.20% (G:13.35% B:0.75%)
Opponent: 47.80% (G:31.62% B:1.49%)
Confidence: ±0.014 (-0.150..-0.122) - [0.0%]
Duration: 52.1 seconds


¹ 2592 Games rolled with Variance Reduction.
Moves: 2-ply, cube decisions: 3-ply Red

eXtreme Gammon Version: 2.03, MET: Kazaross XG2