2012-04-01から1ヶ月間の記事一覧
PC関連は全部カバンに詰め込んだので、後は着替えとかを準備すればOK。 floodgateは19:00の回を最後にしました。Atomマシンで走ってる方も、適当なタイミングで止める予定です。 …問題は始発の電車で調布まで行かなきゃなんない事ですが、まぁ何とかなるかな…
明日・明後日は仕事で出来ないだろうから、今日中にやっとくべき事。 荷造り 強化学習の本を忘れずに 選手権・宿関連のメールを印刷&携帯に転送 PCの環境整備 ネットワーク関連の設定を変更しておく ログ・ソースのバックアップとかの準備 後12時間位あるの…
http://d.hatena.ne.jp/Gasyou/20120429/1335653455 昨日書いた謎の長考ですが、GA将!!!!!側のログを見た所、相手の指し手を受信してから9秒でこちらの指し手を返していました。残りの4分強は、探索もせずに相手の指し手をボーっと待ってたみたいです。 んで…
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2012/04/28/wdoor+floodgate-900-0+InaniwaShogi_Atom-D510_1c+Gasyou5_Core2Duo-P8600_2c+20120428230005.csa 8手目で4分16秒も考えてるんで、何かおかしい。一度ログを見て調べてみないと。
環境はWindows 7 x64,Visual C++ 2008。 手順は下記の通り。 将棋所で適当な条件(5分切れ負けとか)で対局。 デバッグウィンドウの内容を全部テキストファイルにコピー。 grepでGUI→エンジンのコマンドだけ取り出し、usi_command.txtに保存。 VC++でビルド→…
結局、LMRの短縮しない追加の条件は「敵陣かつ敵の利きの無いマスに大駒を打つ」というのがベストでした。「大駒+金駒」に変更すると対sspの勝敗が56-0-59で、ほぼ確実に弱くなってます。 んで、他の細かい改良も終わったんで、これ以降は(バグが出ない限…
http://wdoor.c.u-tokyo.ac.jp/shogi/tools/LATEST/html/current/2012-04-Gasyou5_Core2Duo-P8600_2c-InaniwaShogi_Atom-D510_1c.html 少しは勝てる様になって来ました。今日の14:00の回からだったと思うんですが、思考時間制御をいじったバージョンを投入し…
強化学習の本、布教用に選手権へ持って行こうかどうしようか悩む。 「買うかどうか検討中だけど、高いから迷ってる」って人がいるなら持って行くんだけどなぁ。 興味のある方、コメント貰えれば持って行くんで、よろしく。 ちなみに、手持ちはこの二冊です*1…
ルートノードで合法手が1手だけならノータイムで指す 進行度を基準とした思考時間制御 USIでscore mate対応 LMRの短縮しない条件を追加 Ponder…は無理かな?諦めた LMRで「敵陣で敵の利きの無いマスに駒を打つ手は短縮しない」って条件で、駒種を「大駒のみ…
前回書いた時とは色々変わっちゃったので、現状に合わせて更新しました。 …入玉狙いの学習は成功させたかったなぁ。ネタとして面白そうだったから。残念です。
floodgateでGasyou_Atom-D510_2c4tがずっとGasyou5_Core2Duo-P8600_2cより上にいたんですが、ようやくCore2Duoの方が上に行きました。 まぁ、稲庭スペシャルに負けまくってたから、そりゃRも低め安定になるだろうとは思いますが。 …さて、gps500に追い付きた…
LMRで「敵陣で敵の利きの無いマスに駒を打つ手は短縮しない」という修正を消したものを、sspと連続対戦させてみました。 そしたら結果は85-0-90で勝率48.6%、95%信頼区間は41.0〜56.2。前は203-5-137でそれぞれ59.7、54.3〜65.0だったんですが、弱くなって…
大駒の場合だけ短縮しない様にしましたが、結果は145-2-115で勝率55.8%、95%信頼区間は49.5〜61.9。 となると、やっぱりこの改良はしない方が良いみたいですね。大駒+金駒の場合も同様でしょうから、やめておきます。 後、連続対局中にグローバル詰みテー…
打つ駒の種類を「任意の駒」から「大駒のみ」に変更してみました。 他のルーチン・設定は変更無し。sspとの結果が良ければ、明日夜にでもfloodgateに投入予定です。
昨日書いた修正は改悪になっていた様です。 対sspの勝敗が190-1-164で勝率53.7%。95%信頼区間は48.3〜59.0。修正前は59.7%、54.3〜65.0だったので、多分ダメなんでしょう。 ログを見てない(と言うか、見ても善し悪しが分からない)のですが、ひょっとし…
連続対戦用に評価値に乱数を加算するコードが無効になってたんで、有効にしてsspと再戦。 多少は勝率に影響あるでしょうが、乱数が無いと結果が偏るんで今の設定でやってみます。
ルートノードで合法手が1手だけならノータイムで指す 進行度を基準とした思考時間制御 USIでscore mate対応 Ponder…は無理かな?
前書いた案を変更して、「敵陣で敵の利きの無いマスに駒を打つ手は短縮しない」としました。 んで、現在開発用マシンでsspと連続対局中。弱くなってなければ明日夜にfloodgateに投入予定。 それから、floodgateに選手権用マシン(Core 2 Duo P8600 2コア・2.…
GA将のVer.5(最新版)とVer.4(WCSC20版)で、マシンも2種類。 バージョン CPU 勝敗 勝率 95%信頼区間 5.1(1並列) Core i7 940 203-5-137 59.7 54.3〜65.0 4.0(2並列) 同上 169-1-151 52.8 47.2〜58.4 4.0(2並列) Core 2 Duo P8600 236-2-133 64.0 5…
なんと! 2.7Mnps達成しました!! どう考えてもバグです。一桁二桁間違ってます・・・・
えーっと、上の結果ですが、旧バージョンの方は連続対戦用に評価値に乱数加えた結果でした。 で、乱数加算をやめにしたら、使用している特徴・パラメータの値・評価値が全部一致。つまり、評価関数自体は多分大丈夫。 それから、LMR無しの全幅で初期局面から…
現行バージョンの評価関数での値。 22:33:22 @ core::usi::UsiReceiver::goNewGame() > position== 22:33:22 @ core::usi::UsiReceiver::goNewGame() > +---+---+---+---+---+---+---+---+---+ 22:33:22 @ core::usi::UsiReceiver::goNewGame() > |v香|v桂|v…
前回選手権時に得意とした5八玉型にしないし、序盤で意味も無く1八香とか9八香とかするし… よし、頑張ってデバッグしよう。
http://pc.watch.impress.co.jp/docs/news/20120424_528663.html 基本的にSandy Bridgeを22nmプロセスにシュリンクして、GPUを多少強化した感じでしょうか。 CPUのコアにも手が入ってるみたいですが、性能的にはIPCが高々5%向上って感じですね。 どちらかと…
第20回選手権バージョン(旧パラメータ+並列αβ探索)でsspと一手一秒でやらせたら、現在13-0-10で勝率56.5%、95%信頼区間は34.5〜76.8。上の結果より明らかに強いです。 てことはあれかな、探索のバグ? PVとか評価値とかを比較して、どっか違いが無いか…
グローバル詰みテーブルの修正後の対局は、79-8-310で勝率20.3%、95%信頼区間は16.4〜24.7。 誤差程度ですが、弱くなってますね。少なくとも、強くなってないのは確か。 …さて、前回選手権参加時と同じパラメータ*1の割には弱いので、ちょっとその辺調べな…
旧バージョンのパラメータを使うにしても、準備不足になる予感が。 ヤバイなぁ…今の学習ルーチンに見切りつけるのが遅すぎた? 探索かどっかのバグも未発見だし、ピンチかも。
「敵陣に大駒を打つ手で、打つ場所に敵の利きが無い」ってケースは短縮しない様にした方が良いのかな? 時々、角の打ち込みを見逃してる(Reductionしたせいで、打った角が成る所まで読めない)場合があるし、そういう読み抜けは減らしたいですから。 上記の…
昨日コピペで修正したら、PVがおかしくなる(時々2手指しするPVになってしまう)って現象が起きてました。 んで、これを修正したバージョンを昨日と同じ条件でsspと連続対局中。 それから、いつからかLMRがOFFになっていたんで、これも修正。floodgateには最…
昨夜からsspと各40局対局させた結果です。 0.01,0.02 0.03,0.02 0.09,0.02 0.01,0.04 0.03,0.04 0.09,0.04 20% 16% 5% 12% 13% 13% どれも変わらず弱いですね _| ̄|○