GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2018-10-25から1日間の記事一覧

原点回帰して、PGLeaf(初代)の改良に取り組む事にしました

https://papers.nips.cc/paper/1713-policy-gradient-methods-for-reinforcement-learning-with-function-approximation.pdf http://proceedings.mlr.press/v80/xu18d/xu18d.pdf TDLeaf(λ)とかと組み合わせるのは当面見送って、PGLeaf単体でどこまで行けるか…