aq3948の日記(がわりtwitterまとめ)

twitterのつぶやきをまとめ投稿してます

1月30日(土)のつぶやき

2016-01-31 00:50:02 | 日記

市販の最強の囲碁・天頂の囲碁が32CPU 5秒設定だと力が落ちる、とかはありそうかな?ていうかそもそも32CPUって選べるの?あるいは、G*S将棋みたく(失礼)、キャッシュを莫大に取ってスラッシングで遅くなって実は弱くなってる、とか


【質問】最強の囲碁(2015年版) or 天頂の囲碁5 持ってる方:CPU数(orスレッド数)って設定で選べるのでしょうか?32って選択肢にありますか?(マシンの最大コア数を判定して選択肢を制限してるかもですが)


以前GPS将棋をいろいろいじってたとき、1秒設定にしたら妙に弱くなって、なんで?と思ってたら、1秒だと詰将棋だけで時間使ってほとんど探索できない、と指摘されたことがある
aleag.cocolog-nifty.com/blog/2010/08/p…
32CPU 5秒にもなんかその類の落とし穴があるのかも。

2 件 リツイートされました

たしかに市販版だと、細かい設定チューニングができないからなー。時間配分とかメモリ領域の配分とかで、おかしくなってる可能性は十分ありそう。

あーなんか考えれば考えるほどこれがビンゴな気がしてきた。

1 件 リツイートされました

友人が教員やってる中学校はなんと部活がない。人員配置も適切で、適切な時間も確保されてるそう。
彼女曰く「全部の仕事が勤務時間内に終わるから毎日定時退庁だよ。で、そこから延長保育してもらってる娘をお迎えに行って17時半には帰宅してる」
これを「理想」でなく当たり前にしていかないと。

Eikyu Itoさんがリツイート | 1066 RT

あやねるまで3ホップであることが判明

1 件 リツイートされました

@ark_golgo ええと、Extended Data Table 6の下ですか?このall gamesは互先だけじゃないんですかね。置碁も含めてなんでしょうか。ところで、それがどうかしましたか?


@ark_golgo いえいえ、原因というのとはちょっと違いますが、Fig4aだと4子の効果が約500差に見えますが、これは実は3.5子相当で、4子はもう少し大きいかも(600くらい?)、って話にはなりますね。これは参考になりました。ありがとうございます。



1月29日(金)のつぶやき その2

2016-01-30 00:49:51 | 日記

やっぱり現時点でいちばん可能性が高そうなのは「GがCSの設定間違えてた」かなぁ。これも確かにほんとか?と思うんだけど、他と比較して相対的には現状いちばんもっともらしそう。もちろん何か新情報が入ったら見直すけど。


ていうかAlphaGOがKGSに来りゃいいのか。なんで来ないんだっけ?


対イセドル戦に備えてできるだけ手の内を隠すってことか。なら、イセドル戦後にKGSに来るかに注目かな。それで来ないようだとやっぱ疑わざるをえないかな。(ちなみにイセドルが勝つことは疑ってない)


@dasapon17 ??計測が不正確で実態とずれがあるなら、それは嘘ってことですよね?


@polepole_pawn ??実際にプロ棋士が4~6子で負けてるのですけど…


@dasapon17 分散が大きいんだろうって?それなら確かに「嘘」ではないかもしれませんが、明らかにmisleadingでしょう。すみませんがそういう方向で議論するのは無意味だと思います。


@dasapon17 だからそれだったら、「8勝2敗だからR300差」などと書くのが、少なくとも論文としては間違いですよ。そんな不正確な情報、論文に書くべきではないです。


@dasapon17 すみませんがこれ以上議論しても実りがあるとは思えませんので、以後返信しません。



1月29日(金)のつぶやき その1

2016-01-30 00:49:50 | 日記

.@ohashihirofumi なるほど、そうかもしれません。市販版と最新開発版はそんなに違うものなのですかね?(よく知らないです)


.@ohashihirofumi G論文のFig4aによると、4子差でR500くらいなんですよ。すると2子だとR250くらい?で、Fig4aではCS/Zenは4子ありでもなお400くらい下になってます。市販版だとしても、どう考えてもCS/Zenを過小評価してるように思うのですが。


@kyamamoto9120 @ohashihirofumi たしかに "commercial programs" とありますね。その点は納得です。情報ありがとうございます。


「Fan Hui/AlphaGO 1台版より」400くらい下、です twitter.com/aq3948/status/…


@BigHopeClasic あと、「プロは緩めたから~」とか言ってると、将棋と同じ道を辿りますよw

1 件 リツイートされました

@BigHopeClasic @ohashihirofumi 論文では人間をどう対応づけたのか書いてませんが、いずれにせよ Fan Hui = CS/Zen + 1000 というのはデータとして矛盾していると考えざるをえません。


レート差と置石の関係をググったけど、これ↓のp.20に「150点差1子」とあるけど、これは正しいのかな?だとすると4子で600点。G論文のグラフは4子で500点くらいに見えるので、この点はそれなりにもっともらしそう
kashi.dip.jp/~kashi/rating/…


.@BigHopeClasic 「ソフト1手5秒、棋士30分30秒」の比較はおかしいですよね。 論文は「人間はapproximate correspondence」と書いてるので、AlphaGOとFanは(同じ条件で)ほぼ互角と考えてる、だと思います。するとCS/Zenは合わない


.@BigHopeClasic プレーヤー間の相対的強さを比較するには、それしかないと思いますよ。要は短時間でも長時間でも「同じプレーヤーのレーティングは同じとする」のが肝要。AlphaGOとFanが長時間で対等&AlphaGOとCSが短時間で対等、ならFan=CS、と考えれば。


.@BigHopeClasic たぶんGは(非公式の長時間対局結果から)Fan≒AlphaGO(1台) と考えている。で一方「AlphaGOはCSにほぼ全勝」と言ってる。この2つからは確かにCS≒Fan-1000。ところが「CSは一流プロに4~6子」からはCS≒Fan。ここが謎。

1 件 リツイートされました

@BigHopeClasic @ohashihirofumi いえ、GはFanの棋力は長時間だけで測ってると思います。前のツイートを参照ください。「持ち時間の長短によってパフォーマンスに大きな差がでる」
は今の論点ではないです。


@BigHopeClasic 話がすれ違っているようなので、@BigHopeClasicさんとの議論はここまでとさせていただきます。

1 件 リツイートされました

これの合理的な説明がつかないので悩んでいる。ありがちなのは「CSの設定を間違えてて弱くなってた」なんだけど、あのGがそんな間違いするのか、という気も… でもかと言って、他にうまい説明が見当たらない。 twitter.com/aq3948/status/…


@camo_rabbit @BigHopeClasic それは確かに、特にソフトどうしでは多少あります。ただ1000差はさすがにありえないと思うんですよね…


@ohashihirofumi @camo_rabbit @BigHopeClasic はい、もちろんそのつもりだし、そうだと思いますが。(なんかおかしいですか?)


.@ohashihirofumi かなりラフな「≒」ですが、G論文グラフでFanが2900。トッププロがFan+600なら3500。CSがそれと6子差としても-150x6で2600。4子差なら2900で同じです。ですがG論文グラフのCSは1800で、どう考えても低すぎます。

1 件 リツイートされました

あ、市販だから-250でしたか。でもそれにしてもやはり低すぎですね。 twitter.com/aq3948/status/…


@tanaseY 棚瀬さんはちなみに「CSがFan Hui 2pよりR1000下」は別に変でもない、という見解ですか?


@ohashihirofumi そうですか。棋士さんにそう言われると重みがありますね。たしかに150一定は誤差があるのでしょう。ですがそれにしても、2600 vs 1800はやはり私には大きすぎるギャップに感じられるのですよね。

1 件 リツイートされました

@ohashihirofumi いろいろ教えていただきありがとうございます。もう、やってみないとわからない世界、ってことなんでしょうか。とにかく3月を待つしかなさそうです。


@ark_golgo 情報ありがとうございます。置石とレートの換算があてにならないとすれば、もう判断しようがないですね。3月を待つとしますか。


「そんな訳ないやろ!(裏手ツッコミ)」のいいね!


白バイに、ノーヘルで止められた、うわさのヘルメット。 pic.twitter.com/evUNbNDGzJ

Eikyu Itoさんがリツイート | 9625 RT

いい案思いついた。FBのDarkForestにFan Huiと戦ってもらえばいいんだ。FBなら金出せるだろうし。自ら「CrazyStone/Zenと互角」と言ってるし。そうすればG論文の「AlphaGO 1台(≒Fan Hui)がCS/ZenよりR1000上」が本当か検証できる。


CS/ZenがFan Huiに4子置いて負け越すかっていうと…まあ普通に考えてそんな訳ないよね。てことはやっぱりG論文が嘘だとしか思えないんだけどなぁ



1月28日(木)のつぶやき その2

2016-01-29 00:50:24 | 日記

@demishassabis pros. That means CrazyStone/Zen w/o any handicap is about as strong as Han Fui or AlphaGO(non-distributed).


@demishassabis Correction: CrazyStone/Zen *w/ 4-6 stone hadicap* should be roughly on par with top pros twitter.com/aq3948/status/…


@morikuni_net Fan Huiとやったのはクラスタ版では?



1月28日(木)のつぶやき その1

2016-01-29 00:50:23 | 日記

www3.nhk.or.jp/news/html/2016… こちらでもすでにニュースが公開されています。なお、(たぶんもう言ってもいいと思いますが)明日の朝7:00~のNHKニュースで流れます(私は出ませんが)。あと、おととい夕方からの私と大橋先生のネガティブTweetの原因はこれでしたw。

Eikyu Itoさんがリツイート | 8 RT

Googleの囲碁プログラムが勝ったFan Huiさんはプロ2段か。3月にやるイ・セドルさんは世界トップクラスなので彼に勝ったら本物だけど。これは注目。自分は深層学習だけではトップには勝てないと予想してるけど、深層学習以外に何かやってるのかな。まあ予想外れの可能性もあるけど。

20 件 リツイートされました

Fan Hui氏は世界ランク633位だそう twitter.com/alexjc/status/…

1 件 リツイートされました

しかし3月の電聖戦は一気に興味なくなったな… 他のプログラムに勝っても、だから何、になりそう(まあ負けたらそれなりに面白いかもしれんが)

5 件 リツイートされました

一方FBのザッカーバーグは自身のFacebookで碁について発言している。論文を紹介してる。これから読む
arxiv.org/pdf/1511.06410…

8 件 リツイートされました

今日は仕事はお休みだなw 碁の論文読もう(一応研究職なのでまあ許容範囲)

6 件 リツイートされました

Gの方読んだ。

【学習】
指し手の評価関数(確率分布 p)を3通り、局面の評価関数(v)を1通り作った:
・まず指し手の評価を2通り、教師あり学習で作る。軽いプレイアウト用の(pπ)と、重い木探索用(pθ)。
 ※rolloutって、普通プレイアウトでは?(自分の知識古いかも

5 件 リツイートされました

・更に指し手の評価をもう1通り、強化学習で(pρ)。pρの学習には、初期値としてpθを使う。
・そして局面評価を強化学習で作る(vθ)。これにはpρとの対戦を使う(※ここ具体的に何やったのかよくわからず)。pρはここで使うだけで、対局時は使わない。

5 件 リツイートされました

【探索】
基本MCTSと似ている。各局面(ノード)での確率分布の初期値はpθを使う。リーフノードの評価は、プレイアウトの結果だけでなく、vθによる評価と重みづけする(1:1)。

4 件 リツイートされました

てことで要約すると、
1)指し手の評価がより正確になりました(木探索、プレイアウト共)
2)局面の評価がより正確になりました
3)ノード評価で、局面評価とプレイアウトを重みづけするようにしました
てことみたい。

5 件 リツイートされました

以前たしかRemiさんは「プレイアウトの手選択に凝っても強くならない」と言ってた気がするけど、あれは間違いなのね。まあ直感的にそんなはずなさそうとは思ってたけど。ちょっと不思議なのは、3)の重みづけでレーティングで500近く強くなってる。

4 件 リツイートされました

将棋でいう合議みたいな感じなので多少強くなるくらいはわかるにしても、500は想定外。なんかここにポイントがあるんだろうか。

4 件 リツイートされました

ちなみにレーティングに関しては、Fan Hui氏とAlphaGO1台版がほぼ互角、クラスタ版が+300くらいとのこと。イ・セドル氏はFan Hui氏より600上との情報を見たので(要出典)、それからするとまだトップ棋士には及ばなさそう。まあそれは去年10月の話で、3月は知らんが。

5 件 リツイートされました

モンテカルロが出てきた当初は、既存ソフトより明らかに強くて、みんな「おぉーっ!」となったんだけど、その後そんなに伸びてない。今回も、state of the artは明らかに超えたが、この路線でトップ棋士を超えられるかはまだ何とも言えないかなあ。まあまずは3月のイセドル戦だ。

5 件 リツイートされました

出典は多分Remiさんが作ったレーティング goratings.org
5 Lee Sedol 3515
633 Fan Hui 2916
twitter.com/aq3948/status/…

Eikyu Itoさんがリツイート | 2 RT

えーっ 家のWinはVMWare Playerなんだけど、これもダメなのかな?VMWareのイメージみたいのを作ってVirtualBoxに持ってくのってできるんだっけ(<ggrks) twitter.com/kmo2/status/69…


ちょっと待てよ、やっぱなんかおかしい。ZenやCrazyStoneは一流プロに4~6子で互角のはず。
ja.wikipedia.org/wiki/%E3%82%B3…
だがGoogle論文の図では、4子置いたZen,CrazyStoneがFan Hui(≒AlphaGO)よりもかなり弱いとなってる

15 件 リツイートされました

やっぱGoogle信用できないな。どっかに嘘が混じってる。

13 件 リツイートされました

G論文ではCrazyStoneは32CPUと書いてあり、それなら本気の強さかと思ったが、「一流プロに4~6子」だとすると、Fan HuiやAlphaGOとあまり変わらんレベルということになる。32CPUって、80486x32とかじゃないよねw

12 件 リツイートされました

というわけで、ちょっとAlphaGOの評価は保留だなー。もしかしたら本当に強いのかもしれないけど、これだけじゃ信用できるだけの根拠がない。

14 件 リツイートされました

ちなみにFB論文の方もざっと見てるけど、こちらは「Deep Learning + MCTS でZen/DolBaram/CrazyStone と互角になりました~」という話で、そう衝撃的ではないみたい。

4 件 リツイートされました

ま、G社が "That Day" とかいう手記を出すハメにならないといいけどね。

1 件 リツイートされました

@demishassabis
I have read the paper on AlphaGO. It's just amazing! Congrats on your wonderful achievements. BTW, I have one question;


@demishassabis I would appreciate if you could clarify.
A figure on your paper says that CrazyStone/Zen w/ 4-stone handicap is significantly


@demishassabis weaker than AlphaGO or Fan Hui. However, the match records so far show that CrazyStone/Zen should be roughly on par with top