GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

短期目標含めて更新

まずは短期。

  • ログ出力まわりの整理
  • 評価関数の再実装
    • ついでに王将との相対位置評価を実装
  • 【保留】ルートノードでの枝刈り
  • マルチスレッド化
  • 探索ルーチンの修正
  • ちゃんとプロファイルとる
    • 上の結果次第で、二駒の相対位置関係のチューニング


選手権までの中期的な事項。
// 2009/02/18 22:02 書き忘れてたのを追記

  • 将棋の学習関連
    • TDLeaf(λ)エージェントを再実装。
      • 方策をエージェントから独立させる。
    • 学習中の各種統計情報の収集・表示ルーチン実装。
      • std::vectorあたりを勉強しとくこと。
    • 王手将棋での予備実験。
      • εグリーディーとソフトマックス手法の比較。
      • 評価関数を非線型に修正して、従来バージョンと比較。
      • 先後入れ替えて収束するかテスト。
    • ハッシュ表の再実装。
    • 評価関数でのstd::mapの使用をやめる。
      • ひょっとしたらテンプレートを使用する必要があるかも。ここら辺は要検討。
    • 評価項目の追加:王将との相対位置。
    • 対局部分の並列化。
    • 評価関数に直線探索*1を実装。
    • 将棋のルールの細かい部分の実装。
    • 評価項目の追加:ピン。
  • floodgate参戦
  • 選手権での対局用
    • USIにちゃんと対応。
    • 思考時間制御。
    • やっぱりMTD-∞実装するかも。

*1:と書くと不正確かもしれないが、ニューラルネットの直線探索っぽいルーチン