2010-10-14 そう言えば論文 開発日記 この前書いた「自然方策勾配法に基づくオフポリシー型強化学習法」ですが、買って読んでみました。 さっぱり理解出来ませんでしたが、論文中で関数近似と方策勾配法を組み合わせた手法*1があると書かれていたので、今度はそっちの論文を読んでみます。 例によって英語ですが、まぁ何とかなるでしょう。多分。 *1:http://webdocs.cs.ualberta.ca/~sutton/publications.html#PolicyGradientMethods