2014-08-03から1日間の記事一覧
上で書いた、バグ修正後に全幅3手+静止探索6手で学習したパラメータ。 結果は454-0-88で勝率83.8%、95%信頼区間は80.4〜86.8。 とりあえず、前回の選手権時とほぼ同じ強さになったので、でかいバグは取れたでしょう。多分。
SR-PGLeafで33万局ほど学習したパラメータ。学習時は、昨日書いた静止探索のバグが有るバージョン(連続対局はバグ修正後)。 で、結果。263-0-77で勝率77.4%、95%信頼区間は72.5〜81.7%。 次は、バグ修正後に学習し直したパラメータでやってみます。