ムーブオーダリングの高速化

開発日記

今まではライブラリにあるqsort関数を使ってソートしてたんですが、どうも重いので自前でマージソートを実装。んで、適当に選んだ終盤の入り口くらいの局面だと、NPSが450k位→650k位に向上（一番軽い評価関数で）。まぁ、多少は高速化出来たみたいです。あ…

VS ssp（本将棋モード）

開発日記学習経過

146-1-194で勝率42.9％。95％信頼区間は37.6〜48.4。以前よりは多少強くなってますが、まだまだですね。うーん、一回、学習まわりを実装し直すか？後は序盤のうちに各評価関数が異なった手を選ぶ様に工夫するとか…って、それはそう簡単には行かないか。 …

開発日記

色々考えている事はあるのですが、場合によっては迷走しかねないので確認として書いておきます。自己対戦での評価関数パラメータの自動学習を主軸に置くこれは外せません。TDLeaf(λ)にしろTreeStrap(αβ)にしろ、どっちを使う場合でも基本は自動学習で、っ…