方策オフモードのバグ取り
バグ取りというか何と言うか…
評価関数の値が変な値に更新されている所を、順番に過去にさかのぼってどんどん見ていって、結局バグじゃなくって正常な動作(学習不足でたまたま変な値になっていたらしい)だと結論付けました。
…でも、なんかバグの可能性も捨てきれないので、気持ち悪いですね。
バグ取りというか何と言うか…
評価関数の値が変な値に更新されている所を、順番に過去にさかのぼってどんどん見ていって、結局バグじゃなくって正常な動作(学習不足でたまたま変な値になっていたらしい)だと結論付けました。
…でも、なんかバグの可能性も捨てきれないので、気持ち悪いですね。