GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

そう言えば論文

開発日記

　この前書いた「自然方策勾配法に基づくオフポリシー型強化学習法」ですが、買って読んでみました。

　さっぱり理解出来ませんでしたが、論文中で関数近似と方策勾配法を組み合わせた手法*1があると書かれていたので、今度はそっちの論文を読んでみます。

　例によって英語ですが、まぁ何とかなるでしょう。多分。

*1:http://webdocs.cs.ualberta.ca/~sutton/publications.html#PolicyGradientMethods