学習時の情報表示周りを実装
シングルスレッド学習のコードをコピペしてちょこまかと修正したら完了。意外と楽でした。
とりあえずこれで一晩動かしてみて、問題無い様なら次に行きます。
History Heuristicでオーダリング。静止探索。もうちょっとまともな評価項目。ベンチマーク用のコード整備。パラメータのセーブ・ロード。情報収集の枠組みを作る。方策内でのウィンドウ設定及びオーダリング。必要ならHistory Heuristicの拡張。千日手・連続王手の千日手対応。USI対応。- 全自動での連続対戦環境構築。
- 評価項目を一通り揃える(三駒の関係以外)。
絶対位置評価。- 二駒の相対位置評価。
二駒の絶対位置評価。王将の移動可能な範囲。- 駒の自由度。
- 置換表。
- Scoutとかやってみると面白いかも。
- 持ち駒の優劣関係とか見てみる。
- 同一手順の繰り返しで手損するのを回避。
TODOリスト書くのも久しぶり。とりあえずは連続対戦を全自動でしてくれる環境を作っておきたいですね。その後評価関数を拡張しつつ探索回りをいじる、と。