GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2010-08-31から1日間の記事一覧

う〜ん…

パラメータ修正時に、評価関数をロックしてる間に探索もやってるもんだから、CPU使用率が残念な事になってます。平均だと40%切るかも。 かなりもったいないんで、何か対策考えないと。

今日やった事まとめ

上で書いた修正は、やっぱりと言うか何と言うか、例によってバグ持ちでした。 んで、ちょこまかとバグを潰しつつ他のことも。 学習率を0.001から0.01に上げる。 王手0.5手延長、recapture0.5手延長(これらの効果は重複有り)。 方策内部でのムーブオーダリ…

学習ルーチンをちょっと修正

まず、学習前後の評価値と誤差の変化を見てみました。 すると、序盤は誤差の減少が少なく、終盤に近付くにつれて学習率以上に大きくなっていました。 これは、序盤から順にパラメータを修正していくので、終盤の修正の頃には序盤〜中盤の修正の影響で、修正…

探索深さを2にするとちゃんと学習しない理由

仮説その1 深さが偶数だとNG 理由は置いといて、深さが奇数だと上手く行く、偶数だと上手く行かないってパターン。 方策内部で更に一手全幅で読んでるんで、深さが偶数だと自分の手番で探索を打ち切ります。そうすると、自分の方だけ一手余分に読めるんで、…

YSS-1sって何だろう

http://wdoor.c.u-tokyo.ac.jp/shogi/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=YSS-1s gps500とかGasyou_Atom-D510_1c2tにちらほら負けているけど、それ以外には結構強いし、本物のYSSの一秒将棋モード? うーん、気にな…

VS ssp(本将棋モード)

探索深さを2にして、パラメータ引き継ぎで学習したやつ。 結果は39-1-204で勝率16.0%。95%信頼区間は11.7〜21.3。 問題外なほど弱くなってます orz