前に書いた勝率43%は間違いでした。
間違いと言うか、正確に書くと「評価値に乱数を足していなかったので、同一の手順で勝敗が決したケースが多い」という状況です。
試しに終局時の局面のハッシュコードをログ出力させてみたら、昨夜からの107戦(48-0-59)のうち32局は同一局面で終局していました。
対局開始後2手はランダムに指している為、全対局が重複している訳では無いですが、それでも結構な割合です。
という訳で、これから同一の評価関数パラメータで乱数を加算するバージョンと加算しないバージョンの連続対局をしてみます。