窓際日記・福島原発

窓際という仕事の雑感

電王戦・やねさんの挑戦

2014-11-14 21:05:04 | Weblog
人間の棋譜を参考にせずに評価関数パラメーターを学習させる」ということに集約される様です。<--リンク

つまりは「人間の作った棋譜は、あるいはプロ棋士の棋譜などはいらない」と。

2チャンネラーのいいがかり(失礼!)に反論するにはこれを検証しなくてはいけません。

そうしてこれが「やねさんの挑戦」の本質でありました。


サブテーマとして当然ながら「人が作った定跡は入力しない事」になります。

COM君は自分で「評価関数パラメータを決定」し「定跡も発見」しなくてはいけません。

その手段は「対戦により学ぶ」ということですね。

でもその際の対戦相手は「自分かもしくは自分と同じような生い立ちのソフト」に限られます。

人間が作った棋譜から評価関数パラメータを作り上げたソフトは「人間のコピー」ですからね。

そのようなソフトとの対戦は間接的にではありますが「人との対戦と同等」と見なされます。

そういう訳で当然の事ながら「人との対戦」で学習するのも禁じ手でありますね。


話は飛びますが今回はポナンザややねうら王が自分で定跡を作りだした様でありますね。

しかしながらその発見のベースとなっている評価関数部分の学習は「人の棋譜を使ったもの」でありました。

ですので、「新しい定跡」かもしれませんがそれはCOM君が独力で成し遂げたものではなく、あくまで人との共同作業でありました。


それに対してやねさんの挑戦は「人の棋譜を使わない」、そうして学習の為の「人との対戦もしない」のでありますね。

そうであれば「COM君は独力で将棋を学んでそうして定跡も発見した」と主張できるでありましょう。


しかしこの道は相当にきびしそうであります。

入力できるのは、「それぞれの駒の動きと最初の駒の配置」、それから「先手番と後手番があり王を取られると負け」というルールだけであります。

あるいは「取った駒は自分の駒として盤面に打ち込める」、「敵陣に入ると成り駒できる」、そうして千日手と入玉ルールでしょうか。


さてそれだけのルールセットを与えられたCOM君がはたしてどこまで棋力を向上できるのか?

それは人間の棋力を超えるのか?

そうしてそれは「神の棋譜」に届くのかどうか?<--リンク

確かにこれは将棋ソフト開発者のみならずAI研究者のもつ「はるかなる夢の一つ」なのでありました。


PS
以上のことから考えますに「ようやく登り口が見えたかな」というような所だと思います。

例によってやねさんは「半分は出来た」と豪語されておいでのようですが、、、。

まあそれはいつもの「やねさん流の開発スタイル」なのでありました。



PS
「電王戦記」はこちらから入れます。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする