GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

そう言えば論文

 この前書いた「自然方策勾配法に基づくオフポリシー型強化学習法」ですが、買って読んでみました。

 さっぱり理解出来ませんでしたが、論文中で関数近似と方策勾配法を組み合わせた手法*1があると書かれていたので、今度はそっちの論文を読んでみます。

 例によって英語ですが、まぁ何とかなるでしょう。多分。