もうちょっと詳細に見てみた
王将周辺の利きを見てみると「玉頭に自分の利きが無いと危ない」「相手の玉頭周辺に利きがあれば詰みやすい」位は理解しているみたいです。
絶対位置評価で初期位置の値だけ絶対値が大きい事等とあわせて考えると、やっぱりパラメータの使用頻度が低いと学習が進まないという事でしょうか。
それからもう一つ。王将周辺の利きで「自玉のいる位置に相手の利きがある」場合を評価・学習していましたが、これは詰んでる局面の学習時にしか使用しません。
で、詰んでる時は評価値の目標を-1.0にして学習しているのですが、そうすると上記の場合のパラメータを大きなマイナスにするだけで「詰んでる場合の学習に成功した」とプログラムが誤認する可能性があります。
実際にパラメータを見てみるとそういう現象がありそうですから、とりあえず修正しておきます。