う〜ん…

開発日記

パラメータ修正時に、評価関数をロックしてる間に探索もやってるもんだから、CPU使用率が残念な事になってます。平均だと40％切るかも。かなりもったいないんで、何か対策考えないと。

2010-08-31

今日やった事まとめ

開発日記

上で書いた修正は、やっぱりと言うか何と言うか、例によってバグ持ちでした。んで、ちょこまかとバグを潰しつつ他のことも。学習率を0.001から0.01に上げる。王手0.5手延長、recapture0.5手延長（これらの効果は重複有り）。方策内部でのムーブオーダリ…

2010-08-31

学習ルーチンをちょっと修正

開発日記

まず、学習前後の評価値と誤差の変化を見てみました。すると、序盤は誤差の減少が少なく、終盤に近付くにつれて学習率以上に大きくなっていました。これは、序盤から順にパラメータを修正していくので、終盤の修正の頃には序盤〜中盤の修正の影響で、修正…

2010-08-31

探索深さを2にするとちゃんと学習しない理由

開発日記

仮説その1 深さが偶数だとNG 理由は置いといて、深さが奇数だと上手く行く、偶数だと上手く行かないってパターン。方策内部で更に一手全幅で読んでるんで、深さが偶数だと自分の手番で探索を打ち切ります。そうすると、自分の方だけ一手余分に読めるんで、…

2010-08-31

YSS-1sって何だろう

コンピュータ将棋 floodgate

http://wdoor.c.u-tokyo.ac.jp/shogi/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=YSS-1s gps500とかGasyou_Atom-D510_1c2tにちらほら負けているけど、それ以外には結構強いし、本物のYSSの一秒将棋モード？うーん、気にな…

2010-08-31

VS ssp（本将棋モード）

開発日記学習経過

探索深さを2にして、パラメータ引き継ぎで学習したやつ。結果は39-1-204で勝率16.0％。95％信頼区間は11.7〜21.3。問題外なほど弱くなってます orz

2010-08-30

VS ssp（本将棋モード）

開発日記学習経過

ソフトマックス方策で目標探査率0.1、探索深さ1に設定して一晩走らせたやつ。結果、116-1-186で勝率38.4％。95％信頼区間は32.9〜44.2。まだまだ弱いけど、このパラメータを引き継いで探索深さ2で走らせてるのがあるんで、それでどれだけ強くなるのか。今…

2010-08-29

VS ssp（本将棋モード）

開発日記学習経過

ε=0.5で学習したやつ。結果は107-5-291で勝率26.9％。95％信頼区間は22.6〜31.5。まぁ、なんと言うか…弱いです。

2010-08-28

VS ssp（本将棋モード）

開発日記学習経過

選手権時のパラメータファイルで、現在の探索ルーチン・評価関数・対局条件だとどうなるかを調べてみました。んで、結果。195-5-148で勝率56.9％。95％信頼区間は51.4〜62.2。以前は70％位だったはずですが、今は並列化してないんでこんなもんでしょうか。

2010-08-27

GA将!!!!!には何が足りないのか考えてみた

開発日記

とりあえず、ちゃんと攻めてちゃんと囲って欲しいんで、それに足りないのは何か。仮説その1 評価関数 OR 探索の能力不足以前にBonanza Methodで学習した時は、今とほぼ同じ評価関数・探索ルーチンでちゃんと囲うし攻めてたんで、この可能性は低い。仮説そ…

2010-08-27

BulldozerとBobcat解説記事＠ PC Watch

コンピュータ関連

http://pc.watch.impress.co.jp/docs/column/kaigai/20100827_389491.html 注目は最後の方の記述で、Intelの6コアCPUに対してAMDはBulldozerの8コアCPUを投入すると書かれています。つまり、今ではAMDから全く商品の出ていないハイエンドCPUが、久々に復活…