2008-02-03から1日間の記事一覧
将棋関連 デバッグ 将棋で使う為に強化学習関連のクラスをC++に移植 TDLeaf(λ) αβの高速化 MTD(f) 反復深化 ハッシュ 【保留】実現確率探索 OR ABC探索 Killer Move メタ強化学習のC++への移植 静止探索に脅威の考慮を追加 将棋のルールの細かい部分の実装 ←…
とりあえずコンパイルエラーが無くなる所まで。 探索木はYssTreeで出力する様にしてるんで、明日は動かしながら読み筋を見てみます。 これで従来比4倍位に高速化してくれると嬉しいなぁ。 ちなみに今の形。 基本は手数打ち切りのMTD(f) 反復深化 全幅探索 Ha…
ルートは昨日作って、静止探索はさっき完成したから、あとは通常探索部分を作ってつなげるだけ。 ただ、ハッシュを使うから色々面倒なんだよなぁ。 とりあえずMTD(f)の論文と去年作ったコードを見ながらやりますか。
改良と言うか、学習を速く進める為の修正。なにしろ十分な学習時間が取れなさそうなので。 今の実装だと二つの駒の絶対位置で評価しています。例えば2二の後手角と2八の先手飛車、の様に。 で、これを二つの駒の相対位置で評価しようかと検討中。例えば後…
ファイルに保存したパラメータを見てみると、王将8近傍の移動可能なマスの数の評価が高すぎるのが、ちゃんと囲ってくれない原因かもしれません。 という訳で、一時的に王将の移動範囲の評価を無効にして学習させてみます。 てか、これでちゃんと囲う様になっ…