…失敗でした。少なくとも、1000局で最短手数での勝ちを見つけるまでには至っていません。
それから、昨日の夜から一晩動かしていた、パラメータにボーナスを付加するバージョンですが、そっちも失敗。最短手数を見つける前にボーナスが減りすぎたのが原因ぽいです。
うーん、オプティミスティック初期値*1はもうちょっと改良したいですね。上手く行けば問題が解決しますし。
一番難しいのは、関数近似とオプティミスティック初期値を組み合わせる方法ですか。現状では物凄くいい加減な方法なので、ちゃんとしたやり方を考えないと。