PP絶対を実装&自己対局の条件を変更
まず、評価関数にPP絶対を実装しました。対局時はKPPのテーブルに値を足し込んで使うので、NPSの低下は無いはずです。
これで、ちょっとでも汎化能力が向上すれば嬉しいな、と。
それから、全幅1手+静止探索10手での学習では強くなってくれなかったので、全幅3〜5手+静止探索10手に変更。
全幅部の深さは、一晩2台のマシンで走らせてみて、実用的に行けそうな方を選ぼうと思います。
さて、選手権まで残り57日。何とかなるのかな?
まず、評価関数にPP絶対を実装しました。対局時はKPPのテーブルに値を足し込んで使うので、NPSの低下は無いはずです。
これで、ちょっとでも汎化能力が向上すれば嬉しいな、と。
それから、全幅1手+静止探索10手での学習では強くなってくれなかったので、全幅3〜5手+静止探索10手に変更。
全幅部の深さは、一晩2台のマシンで走らせてみて、実用的に行けそうな方を選ぼうと思います。
さて、選手権まで残り57日。何とかなるのかな?