2012-12-26 まだまだデバッグ中 開発日記 前回の日記以降も、細かい修正とバグ取りを繰り返していました。 んで、ようやくアサーションに引っかからずに学習出来る所まで来たんで、一晩sspと連続対局(5五将棋)。こっちは方策勾配法+駒の前進ボーナス有りの学習バージョン。 結果、勝率72.1%でした。前は70%だったので、「ボーナス無しより弱くなってはいない」位に考えときますか。 という訳で、現在は本命の本将棋で学習中。ちゃんと学習してくれないかなぁ…