GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2018-12-07から1日間の記事一覧

PGLeaf Drei全面的に書き直す事にした

現状 Policy Gradient Methods for Reinforcement Learning with Function Approximation まず、上記論文の関数近似器の導入は断念しました。何をどういじっても、素のPGLeaf以上の性能にはならなかったので。 やった事は大体こんな感じ。 論文の手法をその…