ザックリとリストアップ
優先度順(上ほど高い)で。
- 探索の強化
- ムーブオーダリングの改善(SEEの導入・パラメータ調整)
- LMR
- Null-Move Pruning
- Futility Pruning
- 自己対戦学習時の報酬の与え方を変更
- 銀・桂馬の前進時に報酬を与える
- 詰将棋ルーチンの実装
- 合議方策勾配法の実装
- 合議関連で色々
- 合議クライアントの票数の重みを学習で決定する
- 合議クライアント間での情報共有
- Ponderもどき(相手の思考時間に評価関数パラメータを学習する)
選手権までには合議方策勾配法を実装してみたいけど、間に合うかなぁ…