やっぱりもうちょっと温度高めでやってみます
目標探査回数2回だと探査が少なすぎて局所最適にはまってる感じがするんで、もうちょい探査多めでリトライします。
んで、温度調整を探査回数ベースから探査率ベースに書き換えて、目標探査率10%で学習用マシンに投入。
他の評価関数とかの設定は以前のとおり、現状実装しているもの全部入り。
目標探査回数2回だと探査が少なすぎて局所最適にはまってる感じがするんで、もうちょい探査多めでリトライします。
んで、温度調整を探査回数ベースから探査率ベースに書き換えて、目標探査率10%で学習用マシンに投入。
他の評価関数とかの設定は以前のとおり、現状実装しているもの全部入り。