パラメータを初期値に設定しなおして投入
目標探査率のランダムウォークを有効にした上で、パラメータを初期値(ごく小さな乱数)から再度学習させてみます。
基本的には前の設定と同じですが、静止探索深さだけは1段目6手・2段目無制限に変更しました。
とりあえずかなり時間はかかるかと思いますが、20万局程学習させてみます。
目標探査率のランダムウォークを有効にした上で、パラメータを初期値(ごく小さな乱数)から再度学習させてみます。
基本的には前の設定と同じですが、静止探索深さだけは1段目6手・2段目無制限に変更しました。
とりあえずかなり時間はかかるかと思いますが、20万局程学習させてみます。