GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

予備実験を忘れてたんで追加

  • 予備実験。
    • UCTで序盤を指すと、どの程度の手数まで進めれるか調査。
    • 探索を全幅2手+静止探索にしてVer.3のコードを動かしてみる。
  • 一からコードを書き直す。
    • 三目並べ・リバーシ・将棋を一つの強化学習エージェントで学習可能にする。
    • 評価関数は差分計算を基本にする。
  • 全自動で連続対戦して強さの評価をするルーチン作る。
  • 評価項目の追加。
    • 二駒の絶対位置関係。
    • ひょっとしたら王将・大駒・金駒の三駒の位置関係はやるかも。
  • 序盤はUCTで学習するのを試す。
  • ABC探索。
  • Ponderの実装。
    1. とりあえず普通の。
    2. 相手番に、対局中の局面から学習してみる。
  • 合議制将棋。