結局、上に書いたバグは
終局時の評価値の計算部分でのエラーでした。
んで、それは単にログに吐くだけの目的の値なんで、そこが違っていても学習には問題無し。つまり、バグ修正しても強さは変わらない、とorz
まぁでも、他にもバグあるかもしれないんで、修正バージョンをアサーション有効で一晩走らせてみます。
終局時の評価値の計算部分でのエラーでした。
んで、それは単にログに吐くだけの目的の値なんで、そこが違っていても学習には問題無し。つまり、バグ修正しても強さは変わらない、とorz
まぁでも、他にもバグあるかもしれないんで、修正バージョンをアサーション有効で一晩走らせてみます。