2011-05-01から1ヶ月間の記事一覧
二通りの正則化係数でssp(本将棋モード)と対局させた結果。 正則化係数 勝敗 勝率 95%信頼区間 1e-10 87-0-268 24.5 20.1〜29.3 1e-11 26-1-85 23.4 15.9〜32.4 …弱いですね。うーん… 学習不足かもしれないんで、もうちょっと学習させてみます。
正則化係数を1e-6〜1e-13で一晩学習させたやつ。対局相手はLesserkai1.3.3。 正則化係数 勝敗 1e-6 17-0-3 1e-7 15-1-4 1e-8 19-1-0 1e-9 19-0-1 1e-10 20-0-0 1e-11 20-0-0 1e-12 18-0-2 1e-13 18-0-2 Lesserkaiに20連勝出来ない様じゃ問題外なので、1e-10…
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/05/25/wdoor+floodgate-900-0+Gasyou_Atom-D510_1c2t+gekisen2_i5_480M+20110525210004.csa 相入玉直前で、しかも切れ勝ちしてるw やっぱ、ちゃんと入玉勝宣言を実装しないといけないですね。
学習率は0.1から始めて、2万局後に0.001になるように減少させてみました。 正則化係数は1e-3〜1e-10まで8通り。 んで、結果。各パラメータをLesserkaiと20戦させてみました(途中で打ち切ったのもありますが)。 正則化係数 勝敗 1e-3 1-0-19 1e-4 1-0-9 1e-…
TDLeaf(λ)で学習させたので、http://d.hatena.ne.jp/Gasyou/20110522/1306071278で書いた様に学習率可変のバージョン。 結果、433-?-556で勝率43.8%。95%信頼区間は40.7〜46.9。まぁまぁの勝率です。 んで、今度はガウス正則化を有効にして、本将棋モード…
http://a96sj096.cocolog-nifty.com/weblog/2011/05/fxzambeziallano.html 最上位の8130Pが$320という、やや弱気な価格設定。てっきり$999になるのかと思ってました。 安くても性能良いなら問題無いんですが、安くてそれなりの性能だとちょっと残念なコトに…
今までは学習率固定だったんですが、これを可変にしてみました。ちょっとでも収束速くならないかと思って。 んで、どうやって下げてけば良いか不明なんで、とりあえず初期値を0.1から始めて、20万局かけて0.001まで下げ、その後は0.001固定ってやってみまし…
パラメータを見てみると、飛車・角の持ち駒の価値が成駒(龍・馬)より高くなってる。 そりゃ、一方的に馬作られて平気な顔してるはずだ。 うーん、学習部分のバグって線が濃厚だけど、どこがおかしいのかなぁ…
思い切ってフォーマットしました。 さー、頑張って環境構築するぞー
GA将!!!!!は選手権ルールに合わせて思考時間をx.95秒まで考える様にしてたんですが、floodgateを見てると(多分通信の遅延とかで)x+1秒をオーバーしているみたいです。 という訳で、思考時間をx.8秒まで縮めてみました。今プログラムを入れ替えたんで、今夜…
http://smarter-jp.net/newsetc/24740/ docomoのSH-12CとかauのIS12SHとか。 とりあえず今情報の出てるAndroid端末だと、一番魅力的ですね。 CPUが(多分シングルコアだけど)1.4GHzですし、3Dカメラ&液晶で色々遊べそうですし。 ただ、今の機種も(と言う…
駒割も位置評価もパラメータ見てみると変だし、対局させても全然強くないです。 ただ、初期位置の位置評価が高すぎるって問題は解決してたんで、方向性としては間違ってない…のかな? という訳で、今度は対局開始から50手はランダム指しにして学習させてます…
http://wdoor.c.u-tokyo.ac.jp/shogi/tools/LATEST/players-floodgate14.html InaniwaShogi_Atom-D510_1c 1624 19 69 0.216 2011-05-11 1652 garyu 1572 73 117 0.384 2011-05-11 1600 Gasyou_Atom-D510_1c2t 1571 52 100 0.342 2011-05-11 1599 稲庭将棋さ…
マシンの都合で参戦してなかったんですが、今日の夜から復帰します。パラメータは第20回選手権時のもので、探索ルーチンもこの前まで参戦してたのと同じなんで、多分強さは変わらないはず。てか、弱くなってたらバグです。 それと、Vectorで公開されている稲…
http://computer-shogi-live.cocolog-nifty.com/blog/2011/05/post-2467.html 伊藤さんおめでとうございます。運営&参加者の皆様、お疲れさまでした。 いやぁ、やっぱりこういうお祭りはイイものですね。見てるだけでも楽しかったです。 まぁ、そんなに悠長…
「マル秘企画進行中」とか「7月頃に生放送あるかも」って感じのテロップが流れてたんで、何かイベントあるらしいですね。
歩が置ける場所が無いのに、必死に置き場所を探してリトライ頻発してたみたいです。 という訳で例によって適当に対処。歩は1%の確率でと金にして置く事にしました。
http://homepage.mac.com/junichi_takada/wcsc21/kifu/WCSC21_F2_GEK_PON.html 切れ勝ちになるかと思いきや、千日手になりました。 うーん、まさかこんな手を隠し持っていたとは。
王将の位置評価を見てみると、「とりあえず敵陣に突っ込んどきゃ安全だろう」って感じの値になってました。 初期位置が完全ランダムだとそうなる可能性もあるんで、王将だけは自陣からランダムに場所を選択って方式に変えて、それも並行して走らせてみます。
一晩アサーション有効で走らせてみて、特に引っかかる事はありませんでした。 という訳でアサーション無効にしてからリリースモードで学習開始。 平均手数はランダムな局面からなので、やや短くなって50手前後になってます。
いよいよ決勝の日です。 http://live.nicovideo.jp/watch/lv47425841 ニコニコ生放送で中継するらしいんで、今からスタンバってます。
開始点探査として、ランダムに生成した局面から自己対戦を開始するってのも一つの手かもしれません。 それなら、駒がある程度前進した位置から対局開始する事もあるので、駒を進めて攻めるのもちゃんと学習出来るかもしれません。 どうせ他に有望な手は無い…
上が10局終了後の使用回数、下が1000局終了後。左は使用回数(対局時のPV末端で出現した回数)で、右は使用回数が最大の位置の回数との比率。 ざっと見てみると、初期位置の使用回数が多いのは当然ですが、対局数が増えると初期位置に居座る割合が高くなって…
http://computer-shogi-live.cocolog-nifty.com/blog/2011/05/post-ee3b.html ponanzaさん、Blunderさん、決勝初進出おめでとうございます。 来年の二次シードはWILDCATさんまで確定らしいので、柿木将棋さんやうさぴょんさんが一次からかもしれないって事で…
何をやれば良くなるのかさっぱり見当もつかないです。 とりあえず考えてる事。 ちゃんとデバッグする パラメータのセーブ・ロードまわりにバグが無いか検証 評価関数に特徴を追加 飛車・角・香車の利きを止めている駒の種類(昔Bonanzaが実装してたやつ) 入…
ponanza、芝浦将棋とチルドレンを連続で吹っ飛ばしましたよ。さすが保木さん。
http://computer-shogi-live.cocolog-nifty.com/ Ustream中継観てると、やっぱ会場は楽しそうだなぁ。行きたかったなぁ。 来年こそは学習を成功させて、なんとしてでも参加してやります!
既に駒がある場所に、上書きして別の駒を置いちゃってました。そりゃ行方不明にもなるわ。 という訳で、対処してからも一度リトライ。明日朝までに、もう一件くらいバグ見つからないかな。
まだ、王様が行方不明になったりするバグ持ちなので、今夜はログ出力ありで走らせて再現させてみます。 その他、細かいやり方は下の方でコメントに書いた通りです。
Sunfishさんが堂々の全勝で予選通過。さすがに強いですね。 都合により棋譜はまだ見てないのですが、後でじっくり鑑賞しようと思います。 個人的な明日の見所はやっぱりSunfishさんが二次シード組にどこまで通用するのかですね。あと、floodgateで絶好調のPo…