2016年1月29日のブログ記事一覧-aq3948の日記（がわりtwitterまとめ）

1月28日(木)のつぶやきその２

2016-01-29 00:50:24 | 日記

@aq3948

　Eikyu Ito　@aq3948　23:13

@demishassabis pros. That means CrazyStone/Zen w/o any handicap is about as strong as Han Fui or AlphaGO(non-distributed).

from Twitter Web Client

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　23:14

@demishassabis Could you explain this discrepancy?

from Twitter Web Client

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　23:19

@demishassabis Correction: CrazyStone/Zen *w/ 4-6 stone hadicap* should be roughly on par with top pros twitter.com/aq3948/status/…

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　23:28

@morikuni_net Fan Huiとやったのはクラスタ版では？

返信リツイートお気に入り

1月28日(木)のつぶやきその１

2016-01-29 00:50:23 | 日記

@ark_golgo

　Nobuo Araki@もう少し頑張る　@ark_golgo　03:15

www3.nhk.or.jp/news/html/2016…　こちらでもすでにニュースが公開されています。なお、(たぶんもう言ってもいいと思いますが)明日の朝7:00～のNHKニュースで流れます(私は出ませんが)。あと、おととい夕方からの私と大橋先生のネガティブTweetの原因はこれでしたw。

Eikyu Itoさんがリツイート | 8 RT

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　08:09

Googleの囲碁プログラムが勝ったFan Huiさんはプロ２段か。３月にやるイ・セドルさんは世界トップクラスなので彼に勝ったら本物だけど。これは注目。自分は深層学習だけではトップには勝てないと予想してるけど、深層学習以外に何かやってるのかな。まあ予想外れの可能性もあるけど。

20 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　08:44

Fan Hui氏は世界ランク633位だそう twitter.com/alexjc/status/…

1 件リツイートされました

from Twitter Web Client

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　08:56

しかし３月の電聖戦は一気に興味なくなったな…　他のプログラムに勝っても、だから何、になりそう（まあ負けたらそれなりに面白いかもしれんが）

5 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　09:02

一方FBのザッカーバーグは自身のFacebookで碁について発言している。論文を紹介してる。これから読む
arxiv.org/pdf/1511.06410…

8 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　09:03

今日は仕事はお休みだなw　碁の論文読もう（一応研究職なのでまあ許容範囲）

6 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　15:22

Gの方読んだ。

【学習】
指し手の評価関数（確率分布 p）を３通り、局面の評価関数(v)を１通り作った：
・まず指し手の評価を２通り、教師あり学習で作る。軽いプレイアウト用の(pπ)と、重い木探索用(pθ)。
　※rolloutって、普通プレイアウトでは？（自分の知識古いかも

5 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　15:22

・更に指し手の評価をもう１通り、強化学習で(pρ)。pρの学習には、初期値としてpθを使う。
・そして局面評価を強化学習で作る(vθ)。これにはpρとの対戦を使う（※ここ具体的に何やったのかよくわからず）。pρはここで使うだけで、対局時は使わない。

5 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　15:23

【探索】
基本MCTSと似ている。各局面（ノード）での確率分布の初期値はpθを使う。リーフノードの評価は、プレイアウトの結果だけでなく、vθによる評価と重みづけする(1:1)。

4 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　15:23

てことで要約すると、
1)指し手の評価がより正確になりました（木探索、プレイアウト共）
2)局面の評価がより正確になりました
3)ノード評価で、局面評価とプレイアウトを重みづけするようにしました
てことみたい。

5 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　15:24

以前たしかRemiさんは「プレイアウトの手選択に凝っても強くならない」と言ってた気がするけど、あれは間違いなのね。まあ直感的にそんなはずなさそうとは思ってたけど。ちょっと不思議なのは、3)の重みづけでレーティングで500近く強くなってる。

4 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　15:24

将棋でいう合議みたいな感じなので多少強くなるくらいはわかるにしても、500は想定外。なんかここにポイントがあるんだろうか。

4 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　15:28

ちなみにレーティングに関しては、Fan Hui氏とAlphaGO１台版がほぼ互角、クラスタ版が+300くらいとのこと。イ・セドル氏はFan Hui氏より600上との情報を見たので（要出典）、それからするとまだトップ棋士には及ばなさそう。まあそれは去年10月の話で、3月は知らんが。

5 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　15:33

モンテカルロが出てきた当初は、既存ソフトより明らかに強くて、みんな「おぉーっ！」となったんだけど、その後そんなに伸びてない。今回も、state of the artは明らかに超えたが、この路線でトップ棋士を超えられるかはまだ何とも言えないかなあ。まあまずは３月のイセドル戦だ。

5 件リツイートされました

返信リツイートお気に入り

@tadctw

　tadc　@tadctw　15:42

出典は多分Remiさんが作ったレーティング goratings.org
5 Lee Sedol 3515
633 Fan Hui 2916
twitter.com/aq3948/status/…

Eikyu Itoさんがリツイート | 2 RT

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　21:00

えーっ　家のWinはVMWare Playerなんだけど、これもダメなのかな？VMWareのイメージみたいのを作ってVirtualBoxに持ってくのってできるんだっけ(<ggrks) twitter.com/kmo2/status/69…

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　21:55

ちょっと待てよ、やっぱなんかおかしい。ZenやCrazyStoneは一流プロに４～６子で互角のはず。
ja.wikipedia.org/wiki/%E3%82%B3…
だがGoogle論文の図では、4子置いたZen,CrazyStoneがFan Hui(≒AlphaGO)よりもかなり弱いとなってる

15 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　21:55

やっぱGoogle信用できないな。どっかに嘘が混じってる。

13 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　22:08

G論文ではCrazyStoneは32CPUと書いてあり、それなら本気の強さかと思ったが、「一流プロに４～６子」だとすると、Fan HuiやAlphaGOとあまり変わらんレベルということになる。32CPUって、80486x32とかじゃないよねｗ

12 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　22:10

というわけで、ちょっとAlphaGOの評価は保留だなー。もしかしたら本当に強いのかもしれないけど、これだけじゃ信用できるだけの根拠がない。

14 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　22:29

ちなみにFB論文の方もざっと見てるけど、こちらは「Deep Learning + MCTS でZen/DolBaram/CrazyStone と互角になりました～」という話で、そう衝撃的ではないみたい。

4 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　22:32

ま、G社が "That Day" とかいう手記を出すハメにならないといいけどね。

1 件リツイートされました

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　23:11

@demishassabis
I have read the paper on AlphaGO. It's just amazing! Congrats on your wonderful achievements. BTW, I have one question;

from Twitter Web Client

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　23:12

@demishassabis I would appreciate if you could clarify.
A figure on your paper says that CrazyStone/Zen w/ 4-stone handicap is significantly

from Twitter Web Client

返信リツイートお気に入り

@aq3948

　Eikyu Ito　@aq3948　23:13

@demishassabis weaker than AlphaGO or Fan Hui. However, the match records so far show that CrazyStone/Zen should be roughly on par with top

from Twitter Web Client

返信リツイートお気に入り

goo blog お知らせ

	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	【コメント募集中】goo blogスタッフの気になったニュース
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！

goo blog おすすめ

	おすすめブログ
	【コメント募集中】スタッフの気になったニュース

お客さまのご利用端末からの情報の外部送信について

カレンダー

最新記事

>> もっと見る

カテゴリー

日記(1583)
旅行(0)
グルメ(0)

最新コメント

mariko789w@yahoo.co.jp/3月10日(土)のつぶやき

バックナンバー

2016年12月

2016年11月

2016年10月

2016年09月

2016年08月

2016年07月

2016年06月

2016年05月

2016年04月

2016年03月

2016年02月

2016年01月

2015年12月

2015年11月

2015年10月

2015年09月

2015年08月

2015年07月

2015年06月

2015年05月

2015年04月

2015年03月

2015年02月

2015年01月

2014年12月

2014年11月

2014年10月

2014年09月

2014年08月

2014年07月

2014年06月

2014年05月

2014年04月

2014年03月

2014年02月

2014年01月

2013年12月

2013年11月

2013年10月

2013年09月

2013年08月

2013年07月

2013年06月

2013年05月

2013年04月

2013年03月

2013年02月

2013年01月

2012年12月

2012年11月

2012年10月

2012年08月

2012年07月

2012年06月

2012年05月

2012年03月

2012年02月

2012年01月

2011年12月

2011年11月

2011年10月

2011年09月

2011年08月

2011年07月

2011年06月

2011年05月

2011年04月

2011年03月

2011年02月

2011年01月

2010年12月

2010年11月

2010年10月

2010年09月

ブックマーク

最初はgoo
gooブログトップ
スタッフブログ