2011-11-24から1日間の記事一覧

直線探索を実装

開発日記

以前書いたテストの様子を見てると、序盤の評価値の変化がほとんど無いのがおかしかったです。んで、ちょっと思い付いて直線探索を実装。これで、学習率が0.001なら学習前後で誤差が0.1％だけ減少する様になりました。それから、TD(λ)のλを0.7から0.99に修…