バグってなかったかも
http://d.hatena.ne.jp/Gasyou/20150506/1430919549 の続きです。
どうも、「三目並べで後手だけ学習が上手くいかない」ではなく、「三目並べでは後手の方が学習が難しく、収束が遅い」だったみたいです。
んで、私は収束の大分前のログを見て「バグってる!!」と思い込んでいた、と。
パラメータのセーブルーチン、バグってた
最後の一個の評価関数だけセーブしてなかったっすよ。
つー訳で、sspとの連続対局は保留。
あ、それから一個気になる現象があったので修正。
二駒相対・絶対の評価項目が無いと勝率ダウン・予測報酬の誤差アップでよろしくなさ気なので、二駒相対は常に有効にし、二駒絶対は有効・無効を切り替える様に修正しました。