昨夜から今朝まで約11万局学習したパラメータ。
あ、スペックは今まで書いていませんでしたが、こんな感じ。
- 全幅探索(反復深化)+LMR+2段階静止探索(6手+無制限)
- 評価関数は下記の通り
- 駒割
- 駒の絶対位置評価
- 二駒の相対位置評価
- 二駒の絶対位置評価 ← 昨夜から追加
- 駒の自由度の評価
- 王将の移動可能範囲の評価
- ABC探索ベースの詰将棋ルーチン
んで、結果。
214-?-117で勝率64.7%。95%信頼区間は59.2〜69.8。
今朝の時点では収束していなかった雰囲気があるので、今日寝る前に追加で学習したバージョン(多分35万局前後)をスパーリングさせてみます。