VS ssp(5五将棋モード)
SR-PGLeafで33万局ほど学習したパラメータ。学習時は、昨日書いた静止探索のバグが有るバージョン(連続対局はバグ修正後)。
で、結果。263-0-77で勝率77.4%、95%信頼区間は72.5〜81.7%。
次は、バグ修正後に学習し直したパラメータでやってみます。
SR-PGLeafで33万局ほど学習したパラメータ。学習時は、昨日書いた静止探索のバグが有るバージョン(連続対局はバグ修正後)。
で、結果。263-0-77で勝率77.4%、95%信頼区間は72.5〜81.7%。
次は、バグ修正後に学習し直したパラメータでやってみます。