短期目標含めて更新
まずは短期。
ログ出力まわりの整理評価関数の再実装ついでに王将との相対位置評価を実装
- 【保留】ルートノードでの枝刈り
- マルチスレッド化
- 探索ルーチンの修正
- ちゃんとプロファイルとる
- 上の結果次第で、二駒の相対位置関係のチューニング
選手権までの中期的な事項。
// 2009/02/18 22:02 書き忘れてたのを追記
- 将棋の学習関連
TDLeaf(λ)エージェントを再実装。方策をエージェントから独立させる。
学習中の各種統計情報の収集・表示ルーチン実装。std::vectorあたりを勉強しとくこと。
王手将棋での予備実験。εグリーディーとソフトマックス手法の比較。評価関数を非線型に修正して、従来バージョンと比較。先後入れ替えて収束するかテスト。
ハッシュ表の再実装。評価関数でのstd::mapの使用をやめる。ひょっとしたらテンプレートを使用する必要があるかも。ここら辺は要検討。
評価項目の追加:王将との相対位置。- 対局部分の並列化。
- 評価関数に直線探索*1を実装。
- 将棋のルールの細かい部分の実装。
- 評価項目の追加:ピン。
- floodgate参戦
- 選手権での対局用
- USIにちゃんと対応。
- 思考時間制御。
- やっぱりMTD-∞実装するかも。