今日やったとこまで反映＆細々修正・追加

TODO

将棋関連デバッグ将棋で使う為に強化学習関連のクラスをC++に移植 TDLeaf(λ) αβの高速化 MTD(f) 反復深化ハッシュ【保留】実現確率探索 OR ABC探索 Killer Move メタ強化学習のC++への移植静止探索に脅威の考慮を追加将棋のルールの細かい部分の実装 ←…

MTD(f)完成

開発日記

とりあえずコンパイルエラーが無くなる所まで。探索木はYssTreeで出力する様にしてるんで、明日は動かしながら読み筋を見てみます。これで従来比4倍位に高速化してくれると嬉しいなぁ。ちなみに今の形。基本は手数打ち切りのMTD(f) 反復深化全幅探索 Ha…

開発日記

ルートは昨日作って、静止探索はさっき完成したから、あとは通常探索部分を作ってつなげるだけ。ただ、ハッシュを使うから色々面倒なんだよなぁ。とりあえずMTD(f)の論文と去年作ったコードを見ながらやりますか。

開発日記

改良と言うか、学習を速く進める為の修正。なにしろ十分な学習時間が取れなさそうなので。今の実装だと二つの駒の絶対位置で評価しています。例えば２二の後手角と２八の先手飛車、の様に。で、これを二つの駒の相対位置で評価しようかと検討中。例えば後…

開発日記学習経過

ファイルに保存したパラメータを見てみると、王将8近傍の移動可能なマスの数の評価が高すぎるのが、ちゃんと囲ってくれない原因かもしれません。という訳で、一時的に王将の移動範囲の評価を無効にして学習させてみます。てか、これでちゃんと囲う様になっ…