GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

やっぱ早めに高速化する

 1日500局とかだと学習が進まないので。

 実現確率探索はProb Heuristic*1を使ってやろうかなとか考えていますが、上手くいくかどうかはテストしてみないとなんとも言えないんで後日。

 あと、αβである程度深く読める様になったら詰め将棋要らないかな、とか考えて優先順位を下に。

  • 将棋関連
    • 将棋用の評価関数の実装
      • 駒割
      • 絶対位置による評価
      • 王将との相対位置による評価
      • 二駒の位置関係
      • 王将の動ける範囲
      • 王将周辺の利きの数
    • 将棋で使う為に強化学習関連のクラスをC++に移植
    • TDLeaf(λ)
    • USI対応
    • αβの高速化
      • 反復深化
      • ハッシュ
      • 実現確率探索 OR ABC探索
    • 将棋のルールの細かい部分の実装 ← この辺まで年内にやりたい
      • 千日手・連続王手の千日手の検出
      • 詰みとステイルメイトの区別
      • 打ち歩詰めと打ち歩ステイルメイトの検出
    • 他のソフトとの連続対戦(勝率での検証用)
    • 詰め将棋の実装
    • メタ強化学習C++への移植

*1:History Heuristicの改造バージョン