2014-08-30 バグに悩むこと一週間、発見してから修正は一瞬 開発日記 え〜、上で書いたバグ、原因判明&修正完了。 局面の評価値をシグモイド関数に通して予測勝率に変換している部分があったんですが、コードの2箇所で2回シグモイド関数に通してました。 そりゃ、ちゃんとした動作にならない訳ですよ。はぁ… んで、リバーシでちゃんと動くのを確認したので、学習用マシンに本将棋モードで投入。 金銀桂歩が前進したら報酬にボーナスを与える様にしたので、ひたすら攻める棋風になってくれれば嬉しいなっと。