2007年7月18日のブログ記事一覧-最適化問題に対する超高速＆安定計算

Neuro DP

2007年07月18日 13時12分45秒 | Weblog

10年ほど前に Neuro-Dynamic Programming の本を購入したのだが、その後転勤等によって本を置いていかなければならなかったので、２回も購入したにもかかわらず手元にはない（また購入することにした：３回目）。10年前に読んだときは Policy Iteration(方策反復)や TD 学習などもピンと来なかったのだが、他の強化学習の本なども読んで見ると概念は簡単だ。ただし実際の適用に関しては様々な工夫が必要なことがわかる。Bellman 方程式の定義の仕方や価値関数の収束の方法などのアイデアが悪いと効果が表れない。Bellman 方程式も考え直してみると非常に奥が深い。

2007年7月
日	月	火	水	木	金	土
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

アクセス
閲覧	189	PV
訪問者	156	IP
トータル
閲覧	4,997,377	PV
訪問者	1,258,274	IP

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Neuro DP

カレンダー

Twitter

最新記事

検索

ログイン

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ