このまま方策勾配法で行くか、TDLeaf(λ)に戻るか。 三目並べで実験した限りだと、TDLeaf(λ)の方が扱いが楽と言うか、挙動が把握しやすいと言うか、そんな感触はあります。ただ、それだとチェスの前例をなぞってるだけなんでちょっと面白みが無いかな〜、とい…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。