GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2012-08-15から1日間の記事一覧

VS ssp(5五将棋モード)

方策勾配法・全幅2手で約6万4千局自己対戦学習したパラメータです。 結果は150-0-67で勝率69.1%、95%信頼区間は62.5〜75.2。前回の結果とほぼ同じですね。 これで頭打ちかどうか気になるので、更に1万2千局学習させたバージョンで一晩やらせてみます。

floodgateのマッチメイク改良案をシミュレートしてみました

http://www.sgtpepper.net/kaneko/diary/20120511.html の山下@YSSさんのコメントの案です。 _ 山下@YSS (2012-05-15 20:24) floodgateの対戦の組み方ですが今の勝ち抜きトーナメント?形式はちょっと対戦相手がかたよる傾向があると思います。YssL980X_1c…

5五将棋モード固有のバグだった

5五将棋の連続対戦はプチ将棋を使わせてもらってますが、以前のバージョンではバグか仕様かで打ち歩詰めは反則負けにならない様になっていた記憶があります。 で、それに合わせて探索ルーチンの方も5五将棋モードの場合は打ち歩詰めは単なる「勝ち」として評…

あれ、自己対戦学習がエラーで止まってる

打ち歩詰め判定ルーチン絡みのバグっぽいけど、どこが原因だろう…

VS ssp(5五将棋モード)

方策勾配法・全幅深さ2手で2万6千局のやつ。 結果は188-?-177で勝率51.5%、95%信頼区間は46.2〜56.7。まだ収束していなから弱いって事でしょうか。 今度は今朝まで学習させたパラメータ(約4万4千局)で連続対戦させてみます。