GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

UEC杯までにやるべき事

  1. 評価関数パラメータの学習
  2. 思考時間制御のパラメータ調整
  3. Ponderの検証

 1.は今の学習ルーチンが良い感じなので、ジックリ時間をかけてやれば良いはずです。

 2.に関しては、大会が20分切れ負けなので、最大思考時間を90秒か120秒に設定。んで、思考開始から1秒毎に最善手と合議での票の割れ方をログに出しといて、それをベースに「n秒でm票しか割れていなかったら、ほぼ最善手*1と一致する」という統計を出し、思考時間制御のパラメータを決める予定です。

 ログ出力に関しては合議用のコードをちょっといじって実装して、統計を出すプログラムの方はJavaで実装する予定。現在は1.の学習結果待ちなので、その間にこっちを実装していきます。

 3.に関しては、以前「Ponder有効にすると弱くなる」って現象があったんで、それの検証。

*1:最大思考時間まで探索した結果