GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2012-04-01から1ヶ月間の記事一覧

荷造りほぼ完了

PC関連は全部カバンに詰め込んだので、後は着替えとかを準備すればOK。 floodgateは19:00の回を最後にしました。Atomマシンで走ってる方も、適当なタイミングで止める予定です。 …問題は始発の電車で調布まで行かなきゃなんない事ですが、まぁ何とかなるかな…

選手権の準備

明日・明後日は仕事で出来ないだろうから、今日中にやっとくべき事。 荷造り 強化学習の本を忘れずに 選手権・宿関連のメールを印刷&携帯に転送 PCの環境整備 ネットワーク関連の設定を変更しておく ログ・ソースのバックアップとかの準備 後12時間位あるの…

4分16秒

http://d.hatena.ne.jp/Gasyou/20120429/1335653455 昨日書いた謎の長考ですが、GA将!!!!!側のログを見た所、相手の指し手を受信してから9秒でこちらの指し手を返していました。残りの4分強は、探索もせずに相手の指し手をボーっと待ってたみたいです。 んで…

謎の長考

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2012/04/28/wdoor+floodgate-900-0+InaniwaShogi_Atom-D510_1c+Gasyou5_Core2Duo-P8600_2c+20120428230005.csa 8手目で4分16秒も考えてるんで、何かおかしい。一度ログを見て調べてみないと。

USIエンジンをPGOで最適化

環境はWindows 7 x64,Visual C++ 2008。 手順は下記の通り。 将棋所で適当な条件(5分切れ負けとか)で対局。 デバッグウィンドウの内容を全部テキストファイルにコピー。 grepでGUI→エンジンのコマンドだけ取り出し、usi_command.txtに保存。 VC++でビルド→…

選手権バージョンをFIX

結局、LMRの短縮しない追加の条件は「敵陣かつ敵の利きの無いマスに大駒を打つ」というのがベストでした。「大駒+金駒」に変更すると対sspの勝敗が56-0-59で、ほぼ確実に弱くなってます。 んで、他の細かい改良も終わったんで、これ以降は(バグが出ない限…

対稲庭スペシャル

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/LATEST/html/current/2012-04-Gasyou5_Core2Duo-P8600_2c-InaniwaShogi_Atom-D510_1c.html 少しは勝てる様になって来ました。今日の14:00の回からだったと思うんですが、思考時間制御をいじったバージョンを投入し…

あーそう言えば

強化学習の本、布教用に選手権へ持って行こうかどうしようか悩む。 「買うかどうか検討中だけど、高いから迷ってる」って人がいるなら持って行くんだけどなぁ。 興味のある方、コメント貰えれば持って行くんで、よろしく。 ちなみに、手持ちはこの二冊です*1…

そろそろプログラムはFIXかな

ルートノードで合法手が1手だけならノータイムで指す 進行度を基準とした思考時間制御 USIでscore mate対応 LMRの短縮しない条件を追加 Ponder…は無理かな?諦めた LMRで「敵陣で敵の利きの無いマスに駒を打つ手は短縮しない」って条件で、駒種を「大駒のみ…

アピール文書更新

前回書いた時とは色々変わっちゃったので、現状に合わせて更新しました。 …入玉狙いの学習は成功させたかったなぁ。ネタとして面白そうだったから。残念です。

ようやくAtomマシンより上に行った

floodgateでGasyou_Atom-D510_2c4tがずっとGasyou5_Core2Duo-P8600_2cより上にいたんですが、ようやくCore2Duoの方が上に行きました。 まぁ、稲庭スペシャルに負けまくってたから、そりゃRも低め安定になるだろうとは思いますが。 …さて、gps500に追い付きた…

あれ?

LMRで「敵陣で敵の利きの無いマスに駒を打つ手は短縮しない」という修正を消したものを、sspと連続対戦させてみました。 そしたら結果は85-0-90で勝率48.6%、95%信頼区間は41.0〜56.2。前は203-5-137でそれぞれ59.7、54.3〜65.0だったんですが、弱くなって…

LMRの改良はまた失敗

大駒の場合だけ短縮しない様にしましたが、結果は145-2-115で勝率55.8%、95%信頼区間は49.5〜61.9。 となると、やっぱりこの改良はしない方が良いみたいですね。大駒+金駒の場合も同様でしょうから、やめておきます。 後、連続対局中にグローバル詰みテー…

LMR再修正

打つ駒の種類を「任意の駒」から「大駒のみ」に変更してみました。 他のルーチン・設定は変更無し。sspとの結果が良ければ、明日夜にでもfloodgateに投入予定です。

LMRの修正はダメっぽい

昨日書いた修正は改悪になっていた様です。 対sspの勝敗が190-1-164で勝率53.7%。95%信頼区間は48.3〜59.0。修正前は59.7%、54.3〜65.0だったので、多分ダメなんでしょう。 ログを見てない(と言うか、見ても善し悪しが分からない)のですが、ひょっとし…

連続対戦の設定変更

連続対戦用に評価値に乱数を加算するコードが無効になってたんで、有効にしてsspと再戦。 多少は勝率に影響あるでしょうが、乱数が無いと結果が偏るんで今の設定でやってみます。

選手権までにやりたい事

ルートノードで合法手が1手だけならノータイムで指す 進行度を基準とした思考時間制御 USIでscore mate対応 Ponder…は無理かな?

LMRを少し修正

前書いた案を変更して、「敵陣で敵の利きの無いマスに駒を打つ手は短縮しない」としました。 んで、現在開発用マシンでsspと連続対局中。弱くなってなければ明日夜にfloodgateに投入予定。 それから、floodgateに選手権用マシン(Core 2 Duo P8600 2コア・2.…

昨夜からの連続対局の結果

GA将のVer.5(最新版)とVer.4(WCSC20版)で、マシンも2種類。 バージョン CPU 勝敗 勝率 95%信頼区間 5.1(1並列) Core i7 940 203-5-137 59.7 54.3〜65.0 4.0(2並列) 同上 169-1-151 52.8 47.2〜58.4 4.0(2並列) Core 2 Duo P8600 236-2-133 64.0 5…

記念上げ

なんと! 2.7Mnps達成しました!! どう考えてもバグです。一桁二桁間違ってます・・・・

私 の 頭 が バ グ っ て た ! ! !

えーっと、上の結果ですが、旧バージョンの方は連続対戦用に評価値に乱数加えた結果でした。 で、乱数加算をやめにしたら、使用している特徴・パラメータの値・評価値が全部一致。つまり、評価関数自体は多分大丈夫。 それから、LMR無しの全幅で初期局面から…

バ グ っ て た

現行バージョンの評価関数での値。 22:33:22 @ core::usi::UsiReceiver::goNewGame() > position== 22:33:22 @ core::usi::UsiReceiver::goNewGame() > +---+---+---+---+---+---+---+---+---+ 22:33:22 @ core::usi::UsiReceiver::goNewGame() > |v香|v桂|v…

つーか、明らかにおかしーし

前回選手権時に得意とした5八玉型にしないし、序盤で意味も無く1八香とか9八香とかするし… よし、頑張ってデバッグしよう。

Ivy Bridge正式発表

http://pc.watch.impress.co.jp/docs/news/20120424_528663.html 基本的にSandy Bridgeを22nmプロセスにシュリンクして、GPUを多少強化した感じでしょうか。 CPUのコアにも手が入ってるみたいですが、性能的にはIPCが高々5%向上って感じですね。 どちらかと…

バ グ っ て る

第20回選手権バージョン(旧パラメータ+並列αβ探索)でsspと一手一秒でやらせたら、現在13-0-10で勝率56.5%、95%信頼区間は34.5〜76.8。上の結果より明らかに強いです。 てことはあれかな、探索のバグ? PVとか評価値とかを比較して、どっか違いが無いか…

弱くなってる _| ̄|○

グローバル詰みテーブルの修正後の対局は、79-8-310で勝率20.3%、95%信頼区間は16.4〜24.7。 誤差程度ですが、弱くなってますね。少なくとも、強くなってないのは確か。 …さて、前回選手権参加時と同じパラメータ*1の割には弱いので、ちょっとその辺調べな…

って、選手権まで後10日!?

旧バージョンのパラメータを使うにしても、準備不足になる予感が。 ヤバイなぁ…今の学習ルーチンに見切りつけるのが遅すぎた? 探索かどっかのバグも未発見だし、ピンチかも。

あーそういえばLMRで

「敵陣に大駒を打つ手で、打つ場所に敵の利きが無い」ってケースは短縮しない様にした方が良いのかな? 時々、角の打ち込みを見逃してる(Reductionしたせいで、打った角が成る所まで読めない)場合があるし、そういう読み抜けは減らしたいですから。 上記の…

グローバル詰みテーブルでバグ発見

昨日コピペで修正したら、PVがおかしくなる(時々2手指しするPVになってしまう)って現象が起きてました。 んで、これを修正したバージョンを昨日と同じ条件でsspと連続対局中。 それから、いつからかLMRがOFFになっていたんで、これも修正。floodgateには最…

ボーナスの与え方を色々試した奴

昨夜からsspと各40局対局させた結果です。 0.01,0.02 0.03,0.02 0.09,0.02 0.01,0.04 0.03,0.04 0.09,0.04 20% 16% 5% 12% 13% 13% どれも変わらず弱いですね _| ̄|○