GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

短期目標含めて更新

TODO

まずは短期。

~~ログ出力まわりの整理~~
~~評価関数の再実装~~
- ~~ついでに王将との相対位置評価を実装~~
【保留】ルートノードでの枝刈り
マルチスレッド化
探索ルーチンの修正
ちゃんとプロファイルとる
- 上の結果次第で、二駒の相対位置関係のチューニング

選手権までの中期的な事項。
// 2009/02/18 22:02 書き忘れてたのを追記

将棋の学習関連
- ~~TDLeaf(λ)エージェントを再実装。~~
  - ~~方策をエージェントから独立させる。~~
- ~~学習中の各種統計情報の収集・表示ルーチン実装。~~
  - ~~std::vectorあたりを勉強しとくこと。~~
- ~~王手将棋での予備実験。~~
  - ~~εグリーディーとソフトマックス手法の比較。~~
  - ~~評価関数を非線型に修正して、従来バージョンと比較。~~
  - ~~先後入れ替えて収束するかテスト。~~
- ~~ハッシュ表の再実装。~~
- ~~評価関数でのstd::mapの使用をやめる。~~
  - ~~ひょっとしたらテンプレートを使用する必要があるかも。ここら辺は要検討。~~
- ~~評価項目の追加：王将との相対位置。~~
- 対局部分の並列化。
- 評価関数に直線探索*1を実装。
- 将棋のルールの細かい部分の実装。
  - 千日手・連続王手の千日手の検出。
  - 入玉宣言の実装。
  - 打ち歩詰めの検出。
- 評価項目の追加：ピン。
floodgate参戦
選手権での対局用
- USIにちゃんと対応。
- 思考時間制御。
- やっぱりMTD-∞実装するかも。

*1:と書くと不正確かもしれないが、ニューラルネットの直線探索っぽいルーチン