GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

でっかいバ〜グ見〜つけた〜

 TDLeaf(λ)+ソフトマックス方策で、一部の手で勝ちを読み切った時にそれ以降の手の評価値が変になるというバグを発見。

 で、早速潰して全幅探索深さ0で5五将棋をサクッと10万局程対局・学習させて、現在sspと連続対戦中。

 GA将!!!!!!側から見て32-0-45で勝率41%なんで、そんなに悪くないですね。

 現在は全幅深さを1にして学習させてますが、読みを深くしたんだからもうちょっと強くなってくれないかな。旧バージョンのTDLeaf(λ)で学習させると対sspで勝率60%前後まで行ってたはずなんで、せめてそれには追い付きたいです。