GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

予定変更

TODO

　リバーシの時点で各種技術を実装して、効果を検証した上で将棋に移植します。

　通常のコンピュータ将棋では出てこない用語が色々ありますが、実装したら軽く解説を書きます。

リバーシ関連
- ~~盤面の実装~~
- 評価関数の実装（あまり複雑な事はしない）
  - ~~石の位置・手番による評価~~
  - ~~手数と石の数による評価~~
  - 着手可能数
  - 開放度
- αβの実装
- 必勝読みの実装 ← ここまでの目標 9月2日
- 適格度トレース
- メタ強化学習
- Q学習の拡張（というか、一部処理の削除）
- 非グリーディーな行動選択時限定でのソフトマックス手法の使用
将棋関連
- 将棋で使う為に強化学習関連のクラスをC++に移植
- 詰め将棋の実装
- 将棋用の評価関数の実装 ← ここまでの目標9月中
  - 駒割
  - 絶対位置による評価
  - 王将との相対位置による評価
  - 二駒の位置関係（やらないかも・・・）