SR-PGLeafで全幅1手でザクッと学習*1後、全幅2手でパラメータを引き継いで学習したバージョン。
んで、現在32-0-8で勝率80%。まだまだですね。(まぁ、対局数が少ないんでそもそも80%って値自体信用出来ませんが。)
5五将棋では勝率90%弱まで行ったんで、本将棋でも同様の結果を期待していたのですが、どうも甘かった様です。
原因としては
- 探索が浅い(5五将棋では全幅3手だった。本将棋では1〜2手。)
- 探査が上手く行っていない(自己対戦時のランダムさが足りない?)
- バグってる
辺りが可能性大ですが、どれかなぁ。
sspとの対局を見てると、序盤から評価値が大きく振れている事があるので、2の可能性が一番大きそうですが…
とは言え、具体的にどうこうしようっていう対策がある訳でも無く、どうしたもんか。