リバーシの時点で各種技術を実装して、効果を検証した上で将棋に移植します。
通常のコンピュータ将棋では出てこない用語が色々ありますが、実装したら軽く解説を書きます。
- リバーシ関連
盤面の実装
- 評価関数の実装(あまり複雑な事はしない)
石の位置・手番による評価
手数と石の数による評価
- 着手可能数
- 開放度
- αβの実装
- 必勝読みの実装 ← ここまでの目標 9月2日
- 適格度トレース
- メタ強化学習
- Q学習の拡張(というか、一部処理の削除)
- 非グリーディーな行動選択時限定でのソフトマックス手法の使用
- 将棋関連
- 将棋で使う為に強化学習関連のクラスをC++に移植
- 詰め将棋の実装
- 将棋用の評価関数の実装 ← ここまでの目標9月中
- 駒割
- 絶対位置による評価
- 王将との相対位置による評価
- 二駒の位置関係(やらないかも・・・)