2019-09-10から1日間の記事一覧

探査自体を強化学習問題として解く論文（多分）

強化学習による探索行動の学習強化学習における探査*1を、ε-GreedyやSoftmaxの様な乱数を用いる手法ではなく、過去の経験・知識をもとに実現した論文（だと思う）。論文ではグリッドワールドや迷路を題材にし、意図した通りの結果が実験的に得られたと書か…