TDLeaf(λ)の修正完了
コンピュータ将棋用のソースに、リバーシと同じ修正をしました。
んで、評価関数が先後非対称の絶対位置評価のみ(王手将棋用に適当に作ったやつ)でも、それに二駒の相対位置関係評価を追加した場合でも、どちらもちゃんと収束しました。
ただ、やっぱり余分なパラメータがあると収束は遅くなるみたいで、ざっと3〜4倍は対局数を増やさないと収束しません。
ま、なんにせよちゃんと成功する様になったのは嬉しいんで、当面は今の学習ルーチンで色々データを採ってみます。
コンピュータ将棋用のソースに、リバーシと同じ修正をしました。
んで、評価関数が先後非対称の絶対位置評価のみ(王手将棋用に適当に作ったやつ)でも、それに二駒の相対位置関係評価を追加した場合でも、どちらもちゃんと収束しました。
ただ、やっぱり余分なパラメータがあると収束は遅くなるみたいで、ざっと3〜4倍は対局数を増やさないと収束しません。
ま、なんにせよちゃんと成功する様になったのは嬉しいんで、当面は今の学習ルーチンで色々データを採ってみます。