というか、別々に管理してちゃTODOの意味ナシだと今更気付いた。
んでもって優先順位を色々いじくる。まずはちゃんと学習させて、細かい事はその後。
- 将棋関連
- デバッグ
- 将棋用の評価関数の実装
駒割
絶対位置による評価
王将との相対位置による評価
王将の動ける範囲
王将周辺の利きの数
二駒の位置関係
将棋で使う為に強化学習関連のクラスをC++に移植
- TDLeaf(λ)
- αβの高速化 ← ここまで1月中
- MTD(f)
- 【保留】反復深化
ハッシュ
- 【保留】実現確率探索 OR ABC探索
- 将棋のルールの細かい部分の実装
- 千日手・連続王手の千日手の検出
- 入玉宣言の実装
- 詰みとステイルメイトの区別
- 打ち歩詰めと打ち歩ステイルメイトの検出
- 他のソフトとの連続対戦(勝率での検証用)
- チューニング
- メタ強化学習のC++への移植 ← ここまで2月中
- 並列化
- USIにちゃんと対応 ← ここまで選手権前に
- 【保留】詰め将棋の実装