VS ssp(5五将棋モード)
試しにUSIで指示された秒読み時間の8倍考える様にして、各弱エンジン*1の使うCPU時間を非合議・並列化バージョンと同じにして連続対局させてみました。これで弱くなってるなら、弱いパラメータの評価関数が足を引っ張ってるって事になります。
んで、結果。229-0-177で勝率56.4%。95%信頼区間は51.4〜61.3。
明らかに足引っ張ってます。
つーワケで、今から各評価関数での棋譜との一致率を見るコードでも書いてみます。
明らかな駒の損得が絡む様な局面なら、自己対戦で学習したパラメータでも棋譜とは一致するはずなので、一致率が明らかに低いなら弱いパラメータだと判断出来るんじゃないかと。
*1:合議に参加する個々のエンジン