VS ssp(5五将棋モード・ハンディキャップマッチ) 勝率68.7%
まず、王将の移動可能範囲のパラメータの推移が何かおかしかったんで、一旦この評価項目は無効にしてみました。
学習ルーチンは、損失関数は前に書いた設定のままで、勾配ノイズ*1を実装したもの。
んで、結果。667勝304敗で勝率68.7%。勾配ノイズ無しだと50%台(確か)だったんで、大幅に向上しています。
でもって、現在は王将の移動可能範囲評価を再び有効にして学習中。勾配ノイズの影響で、良い方向にパラメータを学習してくれると嬉しいんですが…