http://arxiv.org/pdf/1608.05081.pdf DQNの次はBBQらしいですよ!
はじめに 「強化学習 将棋」でググッてこのブログに来て貰う人が時々いますが、そう言えばちゃんとした概要を書いていなかったので、自分の復習がてら書いてみます。 んで、まず検索すると出てくる二大キーワード。 マルコフ決定過程(MDP:Markov Decision P…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。