GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

Exploration in Gradient-Based Reinforcement Learning

後で読む

　http://dspace.mit.edu/bitstream/handle/1721.1/6076/AIM-2001-003.pdf?sequence=2