GA将が振り飛車苦手なのは良く分かった (´・ω・`)
前々からずっと気になっていた、本将棋で飛車を振った直後に角道開けて馬を作られる現象、ようやく原因が判明しました。
まず、探索ルーチンの方は正常でした。角道開けてから2七角成まで読めてます。枝刈りのし過ぎとかではありませんでした。
んで、肝心の原因。
- 持ち駒の角の価値が高い(盤上の馬よりやや低い程度)
- 駒割以外の評価値が、馬を作られたマイナス分より高くなっている
要するに「端っこに馬を作られても、こっちは角を手持ちにしてるし、形もいいからOK!!!」と判断している様です。
という訳で、当面はL2正則化を有効にして、駒割以外のパラメータの発散を防ぐのに専念します。またもやメタパラメータ調整地獄の予感。
それから、以前書いたAlphaGoのパクり*1は失敗しました。
お盆のコード供養で復活させたコードですが、どうやら送り返さなきゃいけないみたいですね。
*1:過去の評価関数パラメータ相手に対局&パラメータ修正する