UEC杯までにやるべき事
- 評価関数パラメータの学習
- 思考時間制御のパラメータ調整
- Ponderの検証
1.は今の学習ルーチンが良い感じなので、ジックリ時間をかけてやれば良いはずです。
2.に関しては、大会が20分切れ負けなので、最大思考時間を90秒か120秒に設定。んで、思考開始から1秒毎に最善手と合議での票の割れ方をログに出しといて、それをベースに「n秒でm票しか割れていなかったら、ほぼ最善手*1と一致する」という統計を出し、思考時間制御のパラメータを決める予定です。
ログ出力に関しては合議用のコードをちょっといじって実装して、統計を出すプログラムの方はJavaで実装する予定。現在は1.の学習結果待ちなので、その間にこっちを実装していきます。
3.に関しては、以前「Ponder有効にすると弱くなる」って現象があったんで、それの検証。
*1:最大思考時間まで探索した結果