色々思い付いた事を追加
本当に必要かどうかは後で検討する。(※マーク)
- 将棋関連
- TDLeaf(λ)
- 評価関数に特徴を追加
駒の種類・筋ごとの評価駒の種類・段ごとの評価駒の種類とその駒に利いている自分 or 相手の利きの数の評価駒の種類・移動可能なマスの数(自由度)の評価
- 評価関数のボトルネック調査 → 必要なら自前のハッシュを実装
- 評価関数でパラメータにボーナスを付加(リトライ) ※
- 一手指すごとにボーナスを減少させる ※
- 一手指すごとに学習(ボーナスとセットで実装?) ※
- 探索に詰め将棋を追加 ※
- 探索に頓死チェックを追加 ※
- 学習中の各種統計情報をファイルに書き出し(簡単に見れる様にCSVか何かで)
- 将棋のルールの細かい部分の実装
- 他のソフトとの連続対戦(勝率での検証用)
- ニューロ評価関数
- 予備実験
- C++ on x64で実装
- 線形評価関数を教師としての学習
- CUDAに移植
- 並列化
- メタ強化学習のC++への移植
- 【保留】詰め将棋の実装