やっぱりStand Patは偉大だった
えー、学習結果が変なんじゃないかとここ数日悩んでた訳ですが、原因は静止探索だったみたいです。
パラメータはそのままで、静止探索をStand Patにしたら、普通に強くなりました。Lesserkai相手に108勝14敗の勝率88.5%。
という訳で前言を撤回して「Stand Patはすばらしい!」とさせて頂きます。
さて、それじゃぁ学習用ルーチンもStand Patにしてやり直してみますか。
えー、学習結果が変なんじゃないかとここ数日悩んでた訳ですが、原因は静止探索だったみたいです。
パラメータはそのままで、静止探索をStand Patにしたら、普通に強くなりました。Lesserkai相手に108勝14敗の勝率88.5%。
という訳で前言を撤回して「Stand Patはすばらしい!」とさせて頂きます。
さて、それじゃぁ学習用ルーチンもStand Patにしてやり直してみますか。