2012-05-20 方針に迷う 開発日記 このまま方策勾配法で行くか、TDLeaf(λ)に戻るか。 三目並べで実験した限りだと、TDLeaf(λ)の方が扱いが楽と言うか、挙動が把握しやすいと言うか、そんな感触はあります。ただ、それだとチェスの前例をなぞってるだけなんでちょっと面白みが無いかな〜、という気も。 方策勾配法の方は少しはオリジナルな要素を加えてあるんで、それを大切にしたいという気もありますし… うーん、どうすっかなぁ…