GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

来年に向けてのプラン

  • PGLeafの実装
    • エージェント本体
    • 4x4リバーシの局面クラス・評価関数・探索ルーチン
    • 5五将棋本将棋の局面クラス・評価関数・探索ルーチン
  • ムーブオーダリングの改善
    • History HeuristicとSEEを組み合わせてみる
  • 各種枝刈・探索の短縮
    • LMR
    • null move pruning
    • Extended Futility Pruning
    • 探索木の可視化もやりたい
  • 詰将棋ルーチン
    • とりあえずは今年バージョンと同じABC探索ベースで
  • 合議
    • 複数評価関数で合議
    • クライアント間での情報共有
  • Ponderもどき(相手番での学習)
  • GUI作成
    • 合議の可視化をやってみる

 将棋盤クラスの実装は評価関数のチューニング(特に差分計算周り)にかなり影響するので、よく考えて実装したいですね。

 今の所はInside KFEndに書かれている、壁が分厚い実装で行こうかと検討中。Bitboardはよく分からないし、今の所手生成はボトルネックじゃないので使わない方向で。

 んで、今年は探索の高速化を頑張って、自己対戦強化学習で深い探索を行いたいですね。

 目標は、対局回数が全幅3手で1日10万局、全幅5手で1日1万局位に設定しています。これ位なら、何とか実用化可能な範囲ですし。

 後は、探索の高速化が棋力向上に繋がっているかの検証手段を考えないと。棋譜との一致率とか次の一手問題の正解率を基準にすれば良いのかな? よく分かんないです。

 んで、目標は高く「第4回戦電王戦出場!!」とか言いたいですけど、それはちゃんと動くのを作ってから言う事にします。まずは今年バージョンを超えないとどうにもならないですし。