新バージョン投入
21:00の回から新バージョンを投入します。
最大の変更点は評価関数の処理で、今までは特徴の線形和をシグモイド関数を通してから評価値としていたのを、線形和そのままにしました。
ここのシグモイド関数の処理は強化学習が上手く行ってない時に入れたのですが、手当たり次第に色々やってたのでひょっとしたら不要だったかも、と思い試しに外してみました。
対局時は大して差がないですが*1、学習時の処理は多少変わるはずです。
その他のスペックは、評価項目が駒割・位置評価色々・二駒の相対位置と大駒の自由度。自由度は今回から追加です。自己対局は静止探索のみで150万局。
ローカルでざっと動かしてみた感じ、序盤がやや改善出来ている感じです。
いまだに大駒だけでなんとかしようとしていますけど、飛車が積極的に動いて色々やるんで、多少はマシになったのではないかと。
これでまったりゆうちゃんに追い付くのは…無理でしょうね。
*1:評価値には差が出るけど、任意の二局面の評価値の大小関係は変化しない