昨日書き忘れたいくつかの事
対Bonanza戦での学習ですが、グラフを再掲。
赤と黄色の系列がそれぞれ先手・後手でのGA将!!!!の勝率なんですが、片方が高い時はもう片方が低い傾向にあります。
これが何を意味しているかというと…何なんでしょうね?
評価関数の能力不足で、「先手でBonanzaを罠にはめるパラメータ」と「後手でBonanzaを罠にはめるパラメータ」が両立出来ないからこうなってるって可能性は考えましたが、他にも色々と原因はありそうです。
それから、勝率を計算するコード自体のバグって可能性もまだ残ってます。と言うか、いくらなんでも対Bonanzaで勝率高すぎだろうという疑いは捨て切れません。
まぁ、バグならそのうち判明するでしょうから、じっくりコードをチェックしてみます。