という訳で、どっかバグってる可能性が高いので、ちまちまデバッグしてます。
とりあえず今日は評価関数の二駒相対・二駒絶対以外の部分。ソース眺めてバグを探しつつ、局面と特徴量を出力して間違い探し。
ただ、このやり方は二駒相対とかのデバッグでは使えないですね。目視で間違い探しなんて、特徴の数考えると無理です。なんか別の方法考えないと。
それと、本当にバグが原因で上手く行かないのか?って疑問もあったりして。終盤はそこそこちゃんと学習出来ているので、序盤〜中盤がダメなのはアルゴリズム的な問題って可能性もあります。
という訳で、色々やりつつもほとんど進展無しでした丸