2014-09-27から1日間の記事一覧
Softmax実現確率探索ですが、ある程度はちゃんと学習が進む様になりました。 具体的には、5五将棋でssp相手に271-?-61で勝率81.6%、95%信頼区間が77.0〜85.6。 多分、「全幅探索ベースで前向き枝刈りはLMRのみ」の場合と同じ位の強さです。 んで、今日は着…
Softmax実現確率探索ですが、ある程度はちゃんと学習が進む様になりました。 具体的には、5五将棋でssp相手に271-?-61で勝率81.6%、95%信頼区間が77.0〜85.6。 多分、「全幅探索ベースで前向き枝刈りはLMRのみ」の場合と同じ位の強さです。 んで、今日は着…