谷川さんのYSSの「1四金打ち」への評価のコトバですね。
なんとこの手に驚いて谷川さんはフリーズしました。
それほどに人間の目には「(驚くべき)最悪の一手」に見えたのでしょうね。
山下さんの説明によれば「その時のYSSは設定された探索時間での中では最良の手筋と判断した」のだそうです。
「でも実際には手順が進んでいくとそうではなかった」と。
手順が進んでいくと今まで見えていなかった水平線の向う側がようやく見えてきます。
そこで初めてYSSは反省できるのです。
「しまった」とね。
その結果として評価値ががくんと落ちました。
このようにCOM君の場合は「設定探索時間内」で読んだ手筋が全てなのです。
さて水平線の向う側の見えていない手筋の判断は人にもCOM君にもできません。
でも人間は手筋を読まなくてもひとめで見破ります。
「1四金は味が悪い」とね。
こういうワザはまだまだCOM君にはできないのです。
そのかわりと言ってはなんですが、人間が見落としている手筋をCOM君はよく発見します。
この場合の人間の反応は「すごい手だ」とこうなります。
谷川さんにとってみれば「そんなすごい手を指すのだから、1四金は何かのミスだろう」と思われたのでしょうね。
でも実際はそれはミスでもなんでもなく正常なCOM君の思考能力の一部なのですよ。
人間の感性からすればあるときは「すごい手」を指し、またある時は「残念な手」を指す。
まあこれが今の所のCOM君の実力であります。
さてそうでありますので、この局面での「1四金打ち」だけ修正することはできません。
フリーズのようにソフトのどこかにバグがあって起こっている現象ではないからです。
でも修正する方法はあります。
探索時間を延ばす事で水平線を広げる事ですね。
そうです、その局面だけ探索時間を延ばせばいいのです。
でもこれも今のCOM君には難しい事なのです。
「ここは大事な局面だから山下さん設定の探索時間を超えて探索を継続しよう」という判断をYSSがしなくてはいけません。
ここが難しいところで、ツツカナはそれで苦労している、いろいろと工夫している訳であります。<--リンク
さてもうひとつのやり方がやねさん提案の「局後学習」ですね。
まけた局面を「倍の時間をかけて再探索する」という手法です。
そうすることで水平線をすこし向うに押しやります。
そうすると「今回指した手よりももっと良い手筋が見えるだろう」と。
「そうしたらそれをメモしておけ」と。
「次回の対局で同じ局面に遭遇したらノータイムでメモした手を指せ」と。
そういう戦略であります。
これは人間でいう所の「感想戦」ですね。
やねさんはCOM君に「感想戦機能」を実装したのでした。
このようにやねうらおという人物は本当に「すみにはおけない人」なのであります。
PS
やねさんへ。
山下さんの例にならってやねうら王の思考ログの公開をお願いします。
それから、スマホ版やねうら王の発売予定も教えて下さいませ。
PPS
「電王戦記」はこちらから入れます。
なんとこの手に驚いて谷川さんはフリーズしました。
それほどに人間の目には「(驚くべき)最悪の一手」に見えたのでしょうね。
山下さんの説明によれば「その時のYSSは設定された探索時間での中では最良の手筋と判断した」のだそうです。
「でも実際には手順が進んでいくとそうではなかった」と。
手順が進んでいくと今まで見えていなかった水平線の向う側がようやく見えてきます。
そこで初めてYSSは反省できるのです。
「しまった」とね。
その結果として評価値ががくんと落ちました。
このようにCOM君の場合は「設定探索時間内」で読んだ手筋が全てなのです。
さて水平線の向う側の見えていない手筋の判断は人にもCOM君にもできません。
でも人間は手筋を読まなくてもひとめで見破ります。
「1四金は味が悪い」とね。
こういうワザはまだまだCOM君にはできないのです。
そのかわりと言ってはなんですが、人間が見落としている手筋をCOM君はよく発見します。
この場合の人間の反応は「すごい手だ」とこうなります。
谷川さんにとってみれば「そんなすごい手を指すのだから、1四金は何かのミスだろう」と思われたのでしょうね。
でも実際はそれはミスでもなんでもなく正常なCOM君の思考能力の一部なのですよ。
人間の感性からすればあるときは「すごい手」を指し、またある時は「残念な手」を指す。
まあこれが今の所のCOM君の実力であります。
さてそうでありますので、この局面での「1四金打ち」だけ修正することはできません。
フリーズのようにソフトのどこかにバグがあって起こっている現象ではないからです。
でも修正する方法はあります。
探索時間を延ばす事で水平線を広げる事ですね。
そうです、その局面だけ探索時間を延ばせばいいのです。
でもこれも今のCOM君には難しい事なのです。
「ここは大事な局面だから山下さん設定の探索時間を超えて探索を継続しよう」という判断をYSSがしなくてはいけません。
ここが難しいところで、ツツカナはそれで苦労している、いろいろと工夫している訳であります。<--リンク
さてもうひとつのやり方がやねさん提案の「局後学習」ですね。
まけた局面を「倍の時間をかけて再探索する」という手法です。
そうすることで水平線をすこし向うに押しやります。
そうすると「今回指した手よりももっと良い手筋が見えるだろう」と。
「そうしたらそれをメモしておけ」と。
「次回の対局で同じ局面に遭遇したらノータイムでメモした手を指せ」と。
そういう戦略であります。
これは人間でいう所の「感想戦」ですね。
やねさんはCOM君に「感想戦機能」を実装したのでした。
このようにやねうらおという人物は本当に「すみにはおけない人」なのであります。
PS
やねさんへ。
山下さんの例にならってやねうら王の思考ログの公開をお願いします。
それから、スマホ版やねうら王の発売予定も教えて下さいませ。
PPS
「電王戦記」はこちらから入れます。