2009-06-28 気合入れる為に残項目をリストアップ TODO まずは短期的な事。 History Heuristicでオーダリング。 静止探索。 もうちょっとまともな評価項目 ベンチマーク用のコード整備。 置換表。 評価項目を一通り揃える(三駒の関係以外)。 んで、次回選手権までにしたい事。 予備実験。 UCTで序盤を指すと、どの程度の手数まで進めれるか調査。 探索を全幅2手+静止探索にしてVer.3のコードを動かしてみる。 一からコードを書き直す。 三目並べ・リバーシ・将棋を一つの強化学習エージェントで学習可能にする。 評価関数は差分計算を基本にする。 全自動で連続対戦して強さの評価をするルーチン作る。 評価項目の追加。 二駒の絶対位置関係。 ひょっとしたら王将・大駒・金駒の三駒の位置関係はやるかも。 序盤はUCTで学習するのを試す。 ABC探索。 Ponderの実装。 とりあえず普通の。 相手番に、対局中の局面から学習してみる。 合議制将棋。