合議+方策勾配法の修正
今までは合議サーバでの手選択は「最多得票数の手を選ぶ」という決定論的なものでした。
ただ、これだと上手く探査出来ない可能性があるので、合議サーバでもボルツマン分布を使って手選択する様に修正しました。
やり方は簡単で、合議の票数を基準値として、ボルツマン分布で手を選ぶだけです。
それから、3月4日から静止探索1段目の深さが1手になっていたので、それも6手に戻しました。全幅は今の所無しです。
とりあえずこれで一晩走らせてみて、どの程度強くなるか見てみます。
今までは合議サーバでの手選択は「最多得票数の手を選ぶ」という決定論的なものでした。
ただ、これだと上手く探査出来ない可能性があるので、合議サーバでもボルツマン分布を使って手選択する様に修正しました。
やり方は簡単で、合議の票数を基準値として、ボルツマン分布で手を選ぶだけです。
それから、3月4日から静止探索1段目の深さが1手になっていたので、それも6手に戻しました。全幅は今の所無しです。
とりあえずこれで一晩走らせてみて、どの程度強くなるか見てみます。