2018-12-18 なんとなく、私がやりたいのは最終的にベイズ方策勾配法に落ち着く様な気がしてきた 後で読む http://papers.nips.cc/paper/2993-bayesian-policy-gradient-algorithms.pdf ただ、論文読んでも理論もアルゴリズムもサッパリ分からんw