おー、ちゃんと矢倉っぽく囲うんだ
昨晩からボナンザメソッドで学習してたパラメータを使用。
という訳で、今度はこれをベースに方策勾配法(PGLeaf)で学習させてみます。
上手く行けばボナンザメソッドの序盤と方策勾配法の終盤力が同居出来ないかなぁって皮算用しています。
オープン戦まであと6時間ですが、方策勾配法でちょろっと学習させてみます。
昨晩からボナンザメソッドで学習してたパラメータを使用。
という訳で、今度はこれをベースに方策勾配法(PGLeaf)で学習させてみます。
上手く行けばボナンザメソッドの序盤と方策勾配法の終盤力が同居出来ないかなぁって皮算用しています。
オープン戦まであと6時間ですが、方策勾配法でちょろっと学習させてみます。