goo blog サービス終了のお知らせ 

ダークマター、ホーキング放射、ブラックホールなど

ブラックホール、ダークマター、相対論、そうして賢者の石探索中。

電王戦・第4回電王トーナメント2日目

2016-10-12 04:16:48 | 日記
準々決勝の結果ーー>準決勝進出組決定

準々決勝
 Ponanza     ○ーーーX  Selene    
 浮かむ瀬    ○ーーーX  Qhapaq
 読み太      ○ーーーX  大将軍 
 真やねうら王  ○ーーーX  たこっと      

そうして、読み太、Qhapaq、大将軍、たこっと、は「やねうら王ライブラリー」を使用している模様です。(いわゆる「やねうらチルドレン」といわれるもの)


将棋ソフトは2つメインエンジンを持っています。

一つは探索部といわれる、局面探索を行う部分、そうしてもう一つが選ばれた局面を評価する評価関数です。

そして大量の局面データを準備して収束計算、機械学習を行う必要があるのが、この評価関数です。

やねうらチルドレンはたぶんこの評価関数の部分を「やねうら王ライブラリー」から持ってきているものと思われます。


そうして、もう一つのメインエンジン、探索部はStockFishというチェスのソフトを修正して使うのが主流の様です。

真やねうら王、浮かむ瀬、そうしてたぶんPonanzaもそうしていると思われます。

これはStockFishというソフトが海外の多くのソフトエンジニアによって日夜開発・強化され公開され続けているという事情によります。

そうしてそのレベルは個人で開発できるレベルをとっくに超えているものと思われます。


ところで、知識を明示的に表現できるのがAIの特徴です。

そうして、明示的でありますれば、修正して使用することも可能であります。

その為に、多くの開発者がかかわればそれだけソフトの進化は加速されます。

今、将棋ソフトの世界で起こっている事はまさにそのような状況でありましょう。


人が文明を進化させてきたやり方は、「前人の肩に乗って」、そこを出発点として次に進めたからであります。

その意味では、プロ棋士もソフトも同じ様に「前人の肩に乗って」進歩してきました。

しかしながらソフトの場合はそれに加えて「現時点での多くの人の知識を即座に反映できる」という効果が大きい様です。

そして人の場合は、、、そのような訳にはいきません。

そうやっていろいろな人の知識を集めて作り上げられるソフトでありますから、それと個人で戦う事になるプロ棋士は大変な訳であります。


・・・さて、そういうわけで、チルドレンで準決勝進出は読み太 のみ。

あとの3つは評価関数自前のオリジナル開発ソフト(本家)ということになりました。

PS
某掲示板にこんな情報がのってました。

やねうらお  2016年10月9日 17:56 より:

「ponanzaの探索技術はそれだけでも群を抜いてますよ。

彼らがStockfishチームに入れば、StockfishのレーティングをすぐにR200以上あげると思います。

さくらサーバーが使えなかろうが、彼らの独走は揺るがないでしょう。」

どうやらponanzaは独自の探索部をお持ちの様です。

・・・チームponanza、おそろしや。


PS
「電王戦記」はこちらから入れます<--リンク

特集記事一覧にはこちらから入れます。<--リンク

電王戦・第4回電王トーナメント初日

2016-10-11 03:22:24 | 日記
予選通過は以下のソフトでした。

1位 Ponanza           8勝(全勝)
2位 浮かむ瀬(Aperyの別名) 7勝
3位 読み太            6勝
4位 たこっと            5勝
5位 真やねうら王        5勝
6位 大将軍            5勝
7位 白美神            5勝
8位 Selene            5勝
9位 nozomi            5勝
10位 Qhapaq          5勝
11位 習甦            5勝
12位 うさぴょん2'        5勝
(同勝の場合の順位つけはソルコフによる)

ここまでが予選通過。

そうしてひさびさに登場のツツカナが14位、コンピュータ選手権準優勝の技巧が16位!で予選落ちです。

技巧はWCSCの後でソフトを公開したため、皆さんそれをベンチマークにしてそれぞれのソフトを改良・強化してきたのでありましょう。

そうしてそれが技巧にとってはキビシイ結果につながったものと思われます。


さて、かつてはプロ棋士の棋譜を先生としてそれぞれのソフトは評価関数の学習を行ってきました。

しかしながら時代はもはや次のステージに移行した様です。

COM君は自分自身との対戦を繰り返して経験を積み重ね、学習し強くなる、、、という時代に入りました。

そうしてこれはあのアルファ―碁のとった戦略と同じであります。

そしてそのような戦略をとれるのは、自分で計算機資源を用意できる者か、あるいは協力者を外部に得て計算資源を確保できる者に限られてきます。

つまりは、ある側面では「物量の時代」に入ったのであります。


電王トーナメント、確かにソフトを実行するPCは同一ではありますが開発環境は開発者それぞれで雲泥の差があります。

そうして、それらを含めて「開発者の力として評価する」のが電王トーナメントなのでありました。

ちなみに予選出場ソフトは35で、これはトーナメント史上最多になります。


PS
「電王戦記」はこちらから入れます<--リンク

特集記事一覧にはこちらから入れます。<--リンク