全部は無理だった
やった事。
- 既存の評価項目を無効にする(入玉狙いに関係無さそうなのは外す)
- 駒割と筋・段個別の絶対位置評価だけ残した
- 評価項目追加
- 王将が敵陣にいるかどうか
- 敵陣にいる駒の枚数
- 敵陣及び持ち駒の点数
- 学習率を2ケタ下げて1e-5に変更
- 手生成の変更
- 静止探索1段目で、王将が前進する手も生成
- レポート追加
- 王将が敵陣にいる割合
- 王将の平均位置(段)
- 敵陣にいる駒の枚数
- 駒の平均位置(段)
出来なかった事。
- 評価項目追加
- 王将の敵陣までの経路の有無・距離
これは明日やります。
改良の結果、入玉で終局する割合が1〜2%までは上がったから、このまま学習して入玉率が向上するのに期待しましょう。
んで、例によってパラメータ8通りで学習させてみます。