2013-09-09から1日間の記事一覧

ちょっとずつ前進

開発日記

自然TD学習で、状態価値関数の誤差がちゃんと減少する様にはなりました。んで、こっからさらに2ステップほど計算しなきゃいけない事があるのですが、そっちはまだ見通しが立っていません。時間的に考えると、今やってるのが電王トーナメントまでのラストの…