GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2017-05-02から1日間の記事一覧

COMBINING POLICY GRADIENT AND Q-LEARNING

https://pdfs.semanticscholar.org/c59d/19162ca24f412e4bbb10095c942c71815a57.pdf Abstract読んだ限りでは、表題そのまんまな内容らしい。