2010-08-31 今日やった事まとめ 開発日記 上で書いた修正は、やっぱりと言うか何と言うか、例によってバグ持ちでした。 んで、ちょこまかとバグを潰しつつ他のことも。 学習率を0.001から0.01に上げる。 王手0.5手延長、recapture0.5手延長(これらの効果は重複有り)。 方策内部でのムーブオーダリングを精度重視に修正。ただし、遅くなったので元のアルゴリズムに戻す。 という訳で、今日は学習用マシンで学習させつつ開発用マシンではアサーション有効モードでテストラン&sspとの連続対戦。色々やる事が多くて、頭が混乱しそうです。