自然 TD 学習 : 割引報酬における TD 誤差を利用する自然方策勾配に基づいた強化学習法
http://ci.nii.ac.jp/naid/110003234178
ひょっとしたら今やろうとしている事と方向性が同じかもしれないので、購入して読んでます。
てか、方向性が同じで遥か先に行ってたらどうしよう。嬉しい様な、困る様な。
電王トーナメントまで残り僅かな時間で、果たしてどこまでやれるのか。ちょっと心配になってきました。
http://ci.nii.ac.jp/naid/110003234178
ひょっとしたら今やろうとしている事と方向性が同じかもしれないので、購入して読んでます。
てか、方向性が同じで遥か先に行ってたらどうしよう。嬉しい様な、困る様な。
電王トーナメントまで残り僅かな時間で、果たしてどこまでやれるのか。ちょっと心配になってきました。