TDLeaf(λ)+TreeStrapってのは出来ないかと検討中
序盤はともかく、中盤〜終盤にかけてはTDLeaf(λ)でそこそこ上手く学習してたので、その成果を捨てるのもなんかもったいないです。
という訳で、基本TDLeaf(λ)で探索だけTreeStrapってのは出来ないかと考えています。
まぁ、例によって上手く行かない時の迷走の一環なんで、大して期待もせずに実装してみようと思います。
序盤はともかく、中盤〜終盤にかけてはTDLeaf(λ)でそこそこ上手く学習してたので、その成果を捨てるのもなんかもったいないです。
という訳で、基本TDLeaf(λ)で探索だけTreeStrapってのは出来ないかと考えています。
まぁ、例によって上手く行かない時の迷走の一環なんで、大して期待もせずに実装してみようと思います。