2010-06-02から1日間の記事一覧
探索部分を差し替えるだけなんで、ほとんどコピペで対処。サクっと出来ました。 学習率はTDLeaf(λ)部分は0.001で、TreeStrap(minimax)部分は0.1**5。それぞれで最適だった値にしてみました。 さて、あとは明日の夜に強くなってるかどうかですが…頼むぞ、GA将…
序盤はともかく、中盤〜終盤にかけてはTDLeaf(λ)でそこそこ上手く学習してたので、その成果を捨てるのもなんかもったいないです。 という訳で、基本TDLeaf(λ)で探索だけTreeStrapってのは出来ないかと考えています。 まぁ、例によって上手く行かない時の迷走…
131勝863敗で勝率13.2%、95%信頼区間は11.1〜15.4。 まぁ、まだ学習初期だしこんなもんか、って感じです。