ダメでした _| ̄|○
前に書いた、探索深さをランダムに決める方式での学習ですが、強くなりませんでした。
正確に書くと、学習序盤は比較的伸びが良かったんですが、対局数を増やしてもそっからあんまり伸びませんでした。最終的に、対ssp(5五将棋モード)で勝率77%前後だった様な。
んで、現在は全幅3手+静止探索10手から全幅5手(枝刈り全部有効)+静止探索10手に変更して学習中。
前と同じ評価項目では、勝率が80.5%から81.3%に向上しました。まぁ、微妙な向上幅なんですが。
枝刈り有りでもちゃんと学習できるらしい事が判明したので、本将棋の方でも全幅3手(枝刈り全部有効)+静止探索10手とかの学習が、実用的な時間内で実行出来そうな雰囲気ですね。
それと、現在は評価項目を追加して全幅5手(枝刈り全部有効)+静止探索10手で学習中。評価項目はこんな感じです。
- 駒割。
- 駒の絶対位置評価(P)。
- 王将と他の駒の位置評価(KP)。
- 王将以外の二駒関係(PP)。
- 三駒関係(KKP、KPP)。
- 王将の移動可能範囲の評価。
KPに関しては一部KPPともかぶるんですが、金とと金・成銀等を同一視していない所が異なります。
前に軽く実験した感じですと、P・KPを追加しただけで割と強くなったので、今回も二匹目のドジョウを狙ってやっています。