2010-08-12から1日間の記事一覧
今まではライブラリにあるqsort関数を使ってソートしてたんですが、どうも重いので自前でマージソートを実装。 んで、適当に選んだ終盤の入り口くらいの局面だと、NPSが450k位→650k位に向上(一番軽い評価関数で)。 まぁ、多少は高速化出来たみたいです。あ…
146-1-194で勝率42.9%。95%信頼区間は37.6〜48.4。 以前よりは多少強くなってますが、まだまだですね。 うーん、一回、学習まわりを実装し直すか? 後は序盤のうちに各評価関数が異なった手を選ぶ様に工夫するとか…って、それはそう簡単には行かないか。 …
色々考えている事はあるのですが、場合によっては迷走しかねないので確認として書いておきます。 自己対戦での評価関数パラメータの自動学習を主軸に置く これは外せません。TDLeaf(λ)にしろTreeStrap(αβ)にしろ、どっちを使う場合でも基本は自動学習で、っ…