宇宙論、ブラックホール、ダークマター、ホーキング放射、相対論

ブラックホール、ダークマター、ホーキング放射、相対論 etc etc

電王戦・ポナンザとやねうら王

2013-11-21 09:27:31 | 日記
第3回電王戦ではプロ棋士側は約5カ月間、対戦するソフトの検討期間があります。

これは人間側にとって非常に有利な設定です。

でもCOM君も負けてはおりません。

「上に政策あれば下に対策あり」とは中国の格言(?)であります。


以下COM君側の対策です。

ポナンザは乱数をつかって手筋をぼかす実装をしました。

対COM戦では常に検討した手筋の中の最善手を指していましたが、それでは
プロ棋士の検討のえじきになってしまいます。

仕方がないので、最善手はあきらめて次善の手を指すこともあるように変更です。

まあそれでもそれなりの強さをキープしている模様ですね。<--リンク


もともとポナンザは序盤の定跡にあまりこだわらないソフトです。

あのふわふわした序盤はそういう事を示しています。

今回の実装はそれに輪をかけての対プロ棋士対策用ぼかし戦法ですね。

毎回対戦するたびにプロ棋士側は新しい局面に誘導されます。

それでポナンザのクセを、読み筋パターンを隠そうという訳です。

この手法は自分の戦闘力をけずることになりますが、汎用性はありそうです。


それに対してやねうら王。

プロ棋士との練習対局1局ごとに自動学習してデータベースに登録するそうです。

つまり、対戦あいてのプロ棋士を「ソフトのトレーナー」にしてしまおうという訳ですね。

負ければ反省し勝てばそれを記録する。

こうやってどんどんやねうら王は強くなっていくだろう、、、と。<--リンク

そういう戦略です。


プロ棋士はやねうら王の読み筋パターンをつかもうとします。

やねうら王もまたプロ棋士から勝ち手筋を教えてもらおうとします。

人間とCOM君、練習対局でどちらが相手を上回る学習効果を上げられるか競走ですね。


ただしこれはプロ棋士が素直にトレーニングしてくれるのが前提です。

プロ棋士は練習対局では指さなかった手筋を温存して本戦で使うと効果的かもしれません。

つまりCOM君の学習機能を逆利用して「COM君にトラップを仕込む」ということです。


それからもうひとつ。

やねうら王の手法はあまり汎用性があるようには見えません。

うまく学習できてもそれは練習してくれたプロ棋士に有効なだけで、それ以外の
プロ棋士には効果がない、あるいは逆効果かもしれません。


まあそれでも経緯はともかく、プロ棋士に弟子入りするCOM君が出てきた訳です。

はたして弟子入りしたCOM君、師匠に恩返しができますやら。

これはこれで楽しみなことでありますね。


PS
・「電王戦記」はこちらから入れます。

この記事についてブログを書く
« 10月の成績比較 | トップ | 11月の成績比較 »

日記」カテゴリの最新記事