評価値異常のバグだと思ってたやつ
は、単に評価関数のパラメータが大きくなりすぎて、「勝ち」の評価値を上回っていただけでした。
んで、それに付随してもう一個悩んでたバグも解消。ルートノードの1手目でβカットが起きた時に発生していた様です。
という訳でこいつらはもう解決したと見なして、駒割の学習がちゃんと出来るか確認してみます。
は、単に評価関数のパラメータが大きくなりすぎて、「勝ち」の評価値を上回っていただけでした。
んで、それに付随してもう一個悩んでたバグも解消。ルートノードの1手目でβカットが起きた時に発生していた様です。
という訳でこいつらはもう解決したと見なして、駒割の学習がちゃんと出来るか確認してみます。