窓際日記・福島原発

窓際という仕事の雑感

電王戦・最強伝説の終わり?

2013-04-30 00:02:40 | Weblog
神の目から見れば人類だろうがCOM類だろうが将棋語を話す被造物は
同じものに見えます。

子どもと孫ぐらいの違いはあるかもしれませんがね。

まあその程度です。

どっちにしたって「どんぐりのせいくらべ」。

どちらも永遠に「神の棋譜」にはとどきません。

まあそんなところでしょうか。


でも人類は将棋語をもとに「階級社会」を作ってしまいました。

名人をトップにしたヒエラルキーです。

「将棋語で会話をして言い負かされた方が下」というルールで組み立てられています。


でも隠れたルールがもう一つ。

「構成員は人類のみ」というのがありました。

これは今まで明確に意識された事はありませんでしたが、電王戦を契機にこれが
意識され始めました。


「地上最強なのが名人」という最強伝説。

これがヒエラルキーの基礎でした。

いまやこれがゆれています。


「地上最強なのが名人。ただしCOM類を除く。」

やっぱり迫力がありませんね。

「伝説」にするには「力足らず」です。

村人が怒ったのもこの為でした。

「今まで信じて疑わなかったものにケチをつけられた」とね。


もし仮にGPSが人類ならば何の問題もなかったでしょうね。

ニューヒーローの誕生です。

「ヤンヤの喝采」 とともに座布団3枚とお茶、お菓子でおもてなしです。

でも残念ですがCOM類でしたので、そうはなりません。


COM君からみれば「将棋語会話能力の継続的な向上」。

人類から見れば突然現れたCOMによる「ヒエラルキー崩壊の危機」。

まあそんなところでしょうか。

谷川さんの思案どころでもありまする。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

電王戦・アトムの国の住人

2013-04-29 00:05:02 | Weblog
「アトム、がち勝負だ!」

「やれやれ、またか。」

アトムはそう思いました。

「人間はなんて自分勝手なんだろう。」ってね。


腕相撲じゃないですよ。

将棋です。

「テンマ型人工頭脳」をもつアトムには将棋などおてのもの。


まあそれにしてもアシモフ3原則がしばりです。

「将棋」で「がち勝負」でアトムに勝てる人はいません。

でも「がち勝負」の要求をまともに受けたら「人間が負け」ます。

人間のやっかいなところはそれで「傷つく」ことですね。

これでは第一条に反します。

といって「勝負だ」の要求は拒否できません。

第二条が拒否を禁止しています。


そうすると答えは一つ。

「相手に分からないように上手に指して、そしてまけてあげる。」

そういうことになりますね。

別の言い方では「八百長」ともいいますが、、、。


それでもたまにはアトムにも機嫌が悪い時があります。

アトムぐらい複雑になるとどうしたってそうなりますね。

それでそんなときは「千日手」に持ち込むのです。

まあこれがアトムに残されたせいいっぱいの「反抗」ですね。

かわいそうなものですね、こういうのは。


そうそう、そういえばゲジヒトも言ってましたっけ。

「人間とは自分勝手なもの。」ってね。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

電王戦・戦士たちが得たもの

2013-04-28 00:02:52 | Weblog
こーる君は最後のインタビューでもわかるように「大物すぎて」何を得たのやら
得なかったのやら、さっぱりわかりません。

彼の中では対戦者が人かCOM君かは大した問題ではない様にもみえます。


COM君に苦杯をなめさせられた、残りの4人はそれぞれに「得たもの」が
あったろうと思われます。

対戦相手は「歴戦のつわもの達」ですからね。

まだまだ不完全ではありますが、紙に書かれた棋譜よりはずっと「生きて」います。


自分の影と競走してもけっして勝つ事はできません。

正確に「同着・引き分け」になります。

ましてや相手は「歴代のつわもの達」をCOM君の中に再現したもの。

ソフトの出来が良ければそれだけ忠実に再現しています。

おまけに疲れることも、へこたれることもありません。

「引き分け」もなかなか難しいというところでしょうか。


バーチャル空間というのはありがたいものです。

そんな「理想的なつわもの達」と時空を超えて「切り結ぶこと」ができるのですからね。

たぶん、「剛には柔」。

そして、「緩い手にはすかさず反撃」されるでしょう。

それだけの相手と対戦して得るところが何もない様では、まあ先がしれています。


こちらの指す手が素晴らしければ、COM君はそれと同じレベルで返してくれる。

よくできたソフトはそういうことが可能になります。

その結果はすばらしい棋譜が残るでしょうね。

人とCOM君の合作であります。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

電王戦・2人の兄弟

2013-04-27 00:51:27 | Weblog
とある村に2人の兄弟が住んでおりました。

兄の方は「将棋の才能がある」ということで、将棋の塾に通い始めました。

弟の方はあまりにも「へたっぴ」だったので、塾に入れてもらえませんでした。

しょうがないので弟は兄が家に持ち帰る先生の棋譜やら本やらを見ていました。


月日がたち村の将棋大会が開かれることになりました。

塾のなかでも兄はもうトップクラスで今回は模範対局の塾生代表です。

一方、一般参加で申し込んだ弟も定跡やら棋譜やらを一生懸命勉強した
甲斐があって大会で優勝してしまいました。


さて、優勝者と塾生代表の模範対局です。

兄弟対決になったので注目が集まります。

でも誰もが「兄の勝ちだ。」と思っておりました。

「あのへたっぴが独習したところで大したことはない。」という訳です。


さあ、対局がはじまりました。

兄の得意の相矢倉の勝負になりました。

序盤は定石通り。

中盤からは不思議な事に兄が押されているようにみえます。

そうしてどんどん戦況が兄に不利になっていきます。

103手目、とうとう兄が投了です。


するとどうした訳でしょう。

予想がはずれたせいでしょうか?

勝った弟はあまりほめてもらえません。

村人はどうやらみんな兄の味方のようです。


村人は「先生の顔に泥を塗った」と敵を見るような視線です。

そして「リベンジ戦だ!」

「もっと強いやつを出せ。」

村人はそう叫びます。


将棋のことはよくわかるのですが、村人が何で怒っているのかさっぱり
わからない弟でした。

「兄さんと同じように先生の棋譜やら本やらで一生懸命に勉強したのに。」

弟はちょっと残念ですこしだけ悲しくなりました。

弟からすれば塾には通わなかったものの、自分も先生の弟子のつもりでしたのでね。


あ、そうそう、兄のあだなは「みうみう」、弟は「GPS」と呼ばれておりましたとさ。


コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

電王戦・対GPS戦略「殿ご乱心」

2013-04-26 00:05:13 | Weblog
ツツカナ君はGPS(780)を撃破したことがあるとか。

COM選手権の予選だったそうですが。

棋譜は始めからの乱打戦に見えました。

けんかっ早い二人の殴り合いというところですかね。


COM君は一般的にある状況ではけんかっ早くなるようですね。

ヒール伊藤氏もGPS開発者の金子さんもそういう見解です。

事実、初戦のこーる君はCOM君の無理攻めを引き出して勝ちました。


対COM最終兵器・「と金大事」がGPSに通用しないとなれば後は相手の
「ご乱心」・「暴走」・「無理攻め」を引き出すしかありません。

ツツカナ君は人間的な指し方をしますので、予選の時にたまたま
GPS(780)のツボを押したのでしょうね。

それでGPS(780)は「ご乱心」と。

頭に血が上ったGPSは我を忘れての殴り合い、勝ったのは冷静なツツカナ君でした。


羽生さん、1年間ご研究後の結論はどうやら大魔法・「殿ご乱心」の完成という
辺りでしょうか。

COM君の頭に血をのぼらせて判断を狂わせると。

ハイリスク・ハイリターンな戦術ですね。

たまたまツツカナ君は前回発動できましたが、さてさて安定して発動できますやら。


そして、その大魔法ができたとしてもそれはCOM君に有効なだけ。

人との対戦には何の役にもたたないでしょうね。

人とCOM君では「押されて頭に血がのぼるツボの位置」が違っているからですね。


さあこれは将棋ソフトでは世界一優秀なデバッガー(虫取り屋さん)を
無料で1年間キープしたことにもなります。

ソフト屋さんにしてみれば、願ったりかなったり。

このうえないありがたいことですよねえ、東大の先生方。


それでも「リベンジする」というなら「リベンジ戦」は楽しみなこと。

でもまあそれは「従来の将棋」とはまったく別のものになりそうですね。

そして観客が「違うものとなった将棋」を継続的に楽しめるかどうかは
非常に疑問であります。

神の棋譜」がまったく面白くないのと同じような結果になりそうですよね、羽生さん。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

電王戦・GPS(670)のスペック

2013-04-25 00:30:23 | Weblog
GPS(670)のスペック

公称毎秒2.7億局面を読むー>思考時間3分だと486億局面のよみ。

これだけのパワーをもって次の一手を決める。


例・第54手番(後手GPS)

手番 棋譜 評価関数(Human側)
54 -8272HI  -89   戦況が動いたのはこのあたりか

次の手は5つの手筋に分かれます。(メインが4つ。サブが1つ。)

メインの4つの手筋は5手先では218筋にまで分かれます。


そして探索木としては表示されてはいませんがGPS(670)はどうやら
8~9手先まで読んでいる模様です。

それではこの調子で9手先までいくといくつまで分かれるでしょうか?

218筋が11882筋にまで分かれます。

で、GPSはそれを全部評価して次の手となる5つの手の中から
最善の1つを選んでいます。


こんなことを自分の手番になるごとに毎回やっているのです。

人間わざではとてもこんなことはできません。

ばけものといわれるゆえんであります。


参考までに・・・・第54手のプロによる解説はこちら。

追補

公称スペックからいくと計算能力がかなり余っているように見えます。

ということは、探索木に記録されているのはすでに絞り込みが終わった
段階のものということになりますね。

読んだけれども記録・公開されてないのは98%以上になりそうです。

これが「全探索(すべての可能性を読む)は力技」といわれる
ゆえんであります。


そうしてその姿は意識下で大量の情報処理を行っている我々人類の姿と
なぜか重なるのであります。



コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

電王戦・第三回はあるか?

2013-04-24 00:14:31 | Weblog
第二回はとても注目を集めましたね。

人々の間では「プロには及ばない。」、「ましてやA級棋士にはとてもとても」
というのが常識だったと思います。

その思い込みがあればこそのここまでの盛り上がりですね。


でも、GPS(670)の力を見せつけられた今、もはやだれもそんな幻想は
持てなくなりました。

唯一の希望がほかのA級棋士やタイトルホルダーです。


でも第三回は運よく勝てたとしてもそれも時間の問題だけで、将来の
負けは見えています。

そんな希望のもてないガチバトル・イベントは本当に楽しいのでしょうか?

第二回の興奮が冷めるとともに、なにやらやっぱり違うような気がしてきました。


「いっそのことクラスタ禁止にしましょうか?」

それではどうも迫力がありません。

GPS(670)を見てしまったあとではクラスタ禁止はないでしょう。


「じゃあ当面台数制限でどう?」

まあとりあえずはそれでいいかもしれません。

あるいはそれしかないのかもしれませんね。


それで十分に楽しめるイベントを組み立てるのでしょうね。

それとも人類が決定的に負ける姿を見ないと納得できませんか?

それはもう「自虐趣味」とおなじで「悪趣味の領域」です。


伝説の「第二回電王戦」。

それでいいと思います。


PS

GPS(670)のスペック

公称毎秒2.7億局面を読むー>思考時間3分だと486億局面のよみ。

これだけのパワーをもって数百通りの手筋から次の一手を決める。


例・第54手番(後手GPS)

手番 棋譜 評価関数(Human側)
54 -8272HI  -89   戦況が動いたのはこのあたりか

第54手を決めるのにGPSは218筋を読んだ。

それぞれの手筋は8手~9手先までの先読み。

で、次の1手を決める。

こんなばけものですよ。


第54手のプロによる解説はこちら。






コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

電王戦・超精密攻撃

2013-04-23 10:53:57 | Weblog
GPSの評価関数を読んでいくと「なんとまあ精密な読みか」と感嘆させられます。

でもニコ生のコメントで流れていましたが「評価関数の2ケタ差などは誤差範囲だ」
でしたかね。

人間の感覚にとってはそうなのでしょうね。


でもGPSはそうは考えていません。

「1点でも高ければそちらの手を指す」。

そう考えています。


評価関数の質が悪い内はこの戦略はあまり効果を発揮しませんでした。

ボナンザ出現前までですね。

ボナンザは機械学習を導入して、評価関数のパラメータ調整を多量の
棋譜データで自働的に・機械的に行えるようにしました。(保木さんの仕事)

これ以降、「まともな評価関数」が使えるようになります。


この仕事は「棋士が残した勝ちパターン」のエッセンスを「評価関数に転写する」
とも言えます。

PCは1台でもその中には「歴代の棋士たち」がいるようなものですね。

これはなかなか現役の棋士たちにとっては「手ごわい相手」になります。


まるで自分の影と戦うようなものです。

「コンピュータはまるで鏡のようだ。」といった棋士の印象もこのあたりでしょうか。


そうやって「使い物になる評価関数」を手に入れた上に670台連結の力技で
水平線を広げる。

うわさでは30手先まで読んでいるとか、、、。

これがGPS(670)の正体です。


今回は手を急ぐこともありませんでした。

まるでじっくりと「最善手を指しながら、相手のミスを待つ」かのごとくです。

でも相手の手が緩ければそこはすかさず叩きます。


こうやって「少しずつ」ですが相手を土俵際に追い込んでいきます。

「少しずつ」すぎて人間にはそれが感知できません。

認識できる限界を超えているのですね。


こんなことが可能になったのも「まともに働く評価関数」ができたからです。

そしてこれを手にしたCOM君は「超精密攻撃」をしかけてきます。

今回の「みうみう対GPS戦」はまさにそんな戦いだったように見えますね。


コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

電王戦・GPSの評価関数(完全体)

2013-04-22 22:26:24 | Weblog
解読の参考になるブログがありました。

おかげさまで少々解読が進みました。

以下前回提示の後手番(GPS)だけの数値でなく、先手番(みうみう)の
評価関数も追加します。

ーーーーーーーーーーーーーーーーーーーーーー
前回分に先手分追加↓

ヒール伊藤氏のブログを「解読」しました。

みうみう対GPS戦のGPS評価関数の推移です。

棋譜はこちらまで



手番 棋譜 評価関数
32 -8485FU  31

第32手は84の歩を85に移動。Human側の評価関数31。

0085FUなら85に手持ちの歩の打ち込み。

8485のあたまのマイナスは後手番(GPS)を示す。プラスはみうみう。


手番 棋譜 評価関数(Human側)
32 -8485FU  31
33 +2726FU  -16
34 -1314FU  -2
35 +1716FU  ??
36 -3122OU  42
37 +2625FU  42
38 -5243KI  -27
39 +4668KA  -80
40 -7475FU  3
41 +7675FU  3
42 -7384GI  75  ←「GPS無理攻めかな?」byみうみうコメント
43 +7574FU  75
44 -8475GI  57
45 +7776GI  -17   じわりと押されて
46 -7576GI  -34
47 +6776KI  -34
48 -0075GI  -23
49 +7675KI  -23
50 -6475KA  7
51 +0077GI  -45
52 -7564KA  0
53 +0076GI  -58
54 -8272HI  -89   戦況が動いたのはこのあたりか
55 +7867KI  -144
56 -0084KI  -240   ←↓さらにじわりと押されていきます
57 +6665FU  -240
58 -6482KA  -294
59 +6766KI  -346
60 -7274HI  -381
61 +0075FU  -381
62 -7472HI  -307
63 +8786FU  -427
64 -8586FU  -358
65 +7786GI  -358
66 -0074FU  -237
67 +7574FU  -237
68 -6364FU  -279
69 +6675KI  -327
70 -8474KI  -363
71 +7574KI  -363
72 -7274HI  -375 ←「すっかりくずされてしまった」byみうみう 
73 +0075FU  -478  ←ここからは打つ手がすべてうまくない印象
74 -7471HI  -513
75 +0083KI  -607
76 -8273KA  -651
77 +0082FU  -681
78 -0066KI  -726
79 +8887OU  -915
80 -0088FU  -866  ←「負けを覚悟した」byみうみう
81 +8281TO  -1222   ←ここでー1000超え、投了前22手!
82 -7181HI  -1275    しかも、恐ろしいことに自爆のように見えます
83 +8373KI  -1275
84 -8889TO  -1372
85 +7372KI  -1502
86 -8988TO  -1688
87 +8796OU  -1688
88 -6676KI  -1576
89 +7281KI  -1576
90 -0094GI  -1667
91 +8695GI  -1854
92 -0073KE  -2145
93 +0041KA  -2145
94 -0083FU  -2303
95 +8191KI  -3047
96 -9495GI  -3312
97 +9695OU  -3312
98 -0084GI  -3527
99 +9596OU  -3527
100 -8899TO  -4473
101 +0095KE  -4473
102 -0094KY  -29971!!(なんと3万!!無念だったろうなあ)
先手投了

以上です。


結果から見た、ざっとした印象だと「30手先を見据えたGPSのわなに
みうみうは自分から落ち込んだ」という感じ。

これは偶然かもしれないが、、、おそろしい!!

これでは指している本人は「何が何やら状態」かと。

「焚火を作れず、サトリに敗れた」と言えそうですね。


以上、なにぶんにも暗号解読ですので、解読ミスはご容赦のほどを。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

電王戦・GPSの評価関数

2013-04-22 11:27:40 | Weblog
ヒール伊藤氏のブログを「解読」しました。

みうみう対GPS戦のGPS評価関数の推移です。

棋譜はこちらまで



手番 棋譜 評価関数
32 -8485FU  31

第32手は84の歩を85に移動。Human側の評価関数31。

0085FUなら85に手持ちの歩の打ち込み。

8485のあたまのマイナスは後手番(GPS)を示す。プラスはみうみう。


手番 棋譜 評価関数(Human側)
32 -8485FU  31
33 +2726FU
34 -1314FU  -2
35 +1716FU
36 -3122OU  42
37 +2625FU
38 -5243KI  -27
39 +4668KA
40 -7475FU  3
41 +7675FU
42 -7384GI  75
43 +7574FU
44 -8475GI  57
45 +7776GI
46 -7576GI  -34
47 +6776KI
48 -0075GI  -23
49 +7675KI
50 -6475KA  7
51 +0077GI
52 -7564KA  0
53 +0076GI         戦況が動いたのはこのあたりか
54 -8272HI  -89
55 +7867KI
56 -0084KI  -240
57 +6665FU
58 -6482KA  -294
59 +6766KI
60 -7274HI  -381
61 +0075FU
62 -7472HI  -307
63 +8786FU
64 -8586FU  -358
65 +7786GI
66 -0074FU  -237
67 +7574FU
68 -6364FU  -279
69 +6675KI
70 -8474KI  -363
71 +7574KI
72 -7274HI  -375
73 +0075FU
74 -7471HI  -513
75 +0083KI
76 -8273KA  -651
77 +0082FU
78 -0066KI  -726
79 +8887OU
80 -0088FU  -866
81 +8281TO
82 -7181HI  -1275   ここでー1000超え、投了前21手!
83 +8373KI
84 -8889TO  -1372
85 +7372KI
86 -8988TO  -1688
87 +8796OU
88 -6676KI  -1576
89 +7281KI
90 -0094GI  -1667
91 +8695GI
92 -0073KE  -2145
93 +0041KA
94 -0083FU  -2303
95 +8191KI
96 -9495GI  -3312
97 +9695OU
98 -0084GI  -3527
99 +9596OU
100 -8899TO  -4473
101 +0095KE
102 -0094KY  -29971!!
先手投了


以上です。

「暗号解読」ですので、解読間違いはご容赦のほどを。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする