Gasyou_Atom-D510_2c4tが不安定

開発日記 floodgate

何か、今日になってから一気に不安定になった気が… 思考時間制御入れただけなんだけど、どこが原因かなぁ…

2011-10-21

ひよこ将棋さんに負けてる

開発日記 floodgate

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/10/21/wdoor+floodgate-900-0+hiyoko_shogi_v0.05_1t2m+Gasyou_Atom-D510_2c4t+20111021040002.csa やばい、もうすぐ追いつかれるかも…

2011-10-21

思考時間延長と指し手変化率

開発日記

1票 2票 3票 4票 1秒→5秒での変化確率 0.80137 0.563751 0.360679 0.12433 1秒→25秒での変化確率 0.806897 0.615303 0.400862 0.165746 出現確率 0.0521327 0.324983 0.256601 0.342925 GA将!!!!!とsspとの連続対戦の棋譜から、思考時間を1秒→5秒→25秒と延長…

2011-10-20

持ち時間5分でのsspとの対局結果

開発日記

105-2-73で勝率59.0％。95％信頼区間は51.4〜66.3。持ち時間が長いとssp有利になるんでしょうかね。とりあえず思考時間制御を入れて、この結果を上回るのが当面の目標ですね。

2011-10-20

ひよこ将棋さんには何とか勝てる

開発日記

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/10/20/wdoor+floodgate-900-0+hiyoko_shogi_v0.03_1t2m+Gasyou_Atom-D510_2c4t+20111020083002.csa 53手目６二金打にはちょっと焦りましたが、その後は何とか対処して勝てました。てか、駒割＋全幅探索だけ（…

2011-10-20

LMRの乱数範囲調整

開発日記

昨日のコードから、lmrOffset2ndを1.5〜3.0に修正したバージョン。対sspで110-0-69、勝率61.5％。95％信頼区間は53.9〜68.6。やっぱり修正前の方が良い結果なんで、この変更は破棄します。

2011-10-20

探索深さと思考時間増加の関係

開発日記

GA将!!!!!対sspの棋譜から一手30秒で探索し、探索深さの増加と思考時間の増加割合を調べてみました。んで、結果は上のグラフの通り。序盤は1手で3倍、終盤は1手で4〜6倍って感じだと思います。

2011-10-19

一個上のデータ

開発日記

とりあえず一局分のデータが出ましたが、1手深く読むと大体思考時間が3倍になってます。 …小さすぎる様な気が。どっかで1手で5倍ってデータ見た様な気がするんですが。うーん、データ収集コードのどっかがバグってる？

2011-10-19

思考時間制御に着手

開発日記

…の前に、基本的なデータが必要なのでそっちの収集コードを実装。とりあえず、一手深く読むと思考時間が何倍になるかを調べてみます。んで、次は合議ありで浅く読んだ時の最善手の票数と、更に深く読んだ時の最善手の変化確率を調べて、それが完了したら思…

2011-10-19

今朝からの連続対局の結果

開発日記

http://d.hatena.ne.jp/Gasyou/20111019/1318979427で書いた設定です。結果、95-0-51で勝率65.1％。95％信頼区間は56.7〜72.8。前の方が良さそうなんで、変更部分は元に戻します。

2011-10-19

Rが一気に下がってる

開発日記 floodgate

pishogi戦で異常終了して負けて、それで一気に下がった様です。 lesserpyon_sakura_vps_testやgps500と当たらないとR回復しなさそうですが、なかなかその辺とは対局組まれないですし… てか、pishogiに勝って上位に負けての繰り返しですね。うーん…

2011-10-19

LMRパラメータの乱数化を変更

開発日記

今現在、LMRで短縮する深さを計算するルーチンは下記の様になっていて、"lmrなんちゃら"というパラメータ5個を乱数で初期化しています。 double AlphaBetaSearcher2::calcLmrOffset( const size_t depth, // 探索深さ const size_t rank, // 先頭から何番目…

2011-10-19

昨夜からの連続対局結果

開発日記

LMRパラメータの乱数初期化は元のコードのままで、勝敗読み切った場合はすぐ指す様にだけ修正したバージョン。結果、120-3-50で勝率70.6％。95％信頼区間は63.1〜77.3。昨日の昼間の結果とほぼ同じなんで、エンバグしてるってコトは無さそうです。

2011-10-19

Gasyou_Atom-D510_2c4tが不安定

開発日記 floodgate

参戦直後からちょくちょく落ちてますが、なんなんだろう… どうも、終盤の詰将棋ルーチン動作時に問題がありそうな気がしますが、それも確証無いですし… とりあえず詰将棋ルーチンを外して様子を見てみます。

2011-10-18

LMRのパラメータを乱数で初期化しての合議

開発日記

今朝からsspと対局させてて、その結果。 99-1-47で勝率67.8％。95％信頼区間は59.6〜75.3。初期化無しの合議より強くなっている確率は62％。乱数の範囲が適当過ぎたかもしれないんで、その辺いじって今夜一晩対局させてみます。それから、評価値が「ほぼ勝…

2011-10-18

8:00の回から合議バージョンを投入

開発日記 floodgate

Gasyou_Atom-D510_2c4tってヤツです。んで、マシンの都合上InaniwaShogi_Atom-D510_1cは参戦中断します。GA将!!!!!の方で4スレッド使い切っちゃうんで、他のソフトを動かしている余裕は無いんで。初戦はpishogiさんと。これはさすがに勝つでしょう

2011-10-18

連続対戦結果（一晩分）

開発日記

対sspで1手1秒、GA将!!!!!側は1クライアントでの合議と4クライアントでの合議。結果、1クライアントだと139-2-79で勝率63.8％、95％信頼区間は57.0〜70.1。4クライアントだと80-3-41で勝率66.1％、95％信頼区間は56.9〜74.5。礒部さんの勝率検定補助ツール…

2011-10-17

バグ修正出来たかも

開発日記

合議関連ではなく、αβ探索自体のバグでした。で、元々バグはあったが顕在化しにくい状態*1だったんですが、それが合議対応でαβの処理を少しいじった時に表面に出て来たみたいです。修正してsspと連続対戦中ですが、現在20-0-11。まだ何とも言えませんが、…

2011-10-17

続・シングルエンジンでの強さ

開発日記

10/15のソース*1からビルドしたものと、最新版で1クライアントの合議にしたものをsspと連続対戦させてみました。結果、前者は169-3-129で勝率56.7％、95％信頼区間は50.9〜62.4。後者は108-2-94で勝率53.5、95％信頼区間は46.3〜60.5。合議実装前の結果（…

2011-10-16

シングルエンジンでの強さ

開発日記

合議*1を実装したんですが、どうにも弱いです。具体的に言うと、ssp相手に勝率6割行くか行かないか位。んで、試しにクライアント数1での合議（これは、合議無しと同じ動作になるはず）と合議無しの2パターンでsspと対局させてみました。条件は前と同じで、1…

2011-10-14

旧評価関数を使える様にしました

開発日記

んで、ちょっとインタフェースが変わったので、弱くなってないかテスト。条件は旧評価関数（前回選手権時のパラメータ）＋現行の探索ルーチン。対局相手はsspで一手一秒*1。結果、43-0-21で勝率67.2％。95％信頼区間は54.3〜78.4。対局数少ないんではっき…

2011-10-14

合議中心にスケジュールを再構築

TODO

選手権まで残り201日。微妙に切羽詰まって来ました。という訳で、思い切ってスケジュール変更。学習は一旦保留します。シグモイド関数無しでの方策勾配法実装は完了。現在テスト中。レポート収集系の整理パラメータのセーブ・ロードまわりのテスト ※問…

2011-10-13

選手権まで残り202日

開発日記

な訳ですが、学習の方は全く進展無し。ブログにはまだ書いてないけど、裏でゴチャゴチャやってるんですが、それもちょっと微妙な感じですし（これに関しては後日書きます）。んで、さすがに2年連続で出ないのもなんですし、学習意外でちょっと改良してみよ…

2011-10-12

AMD FX-series発表

コンピュータ関連

http://www.4gamer.net/games/100/G010000/20111012001/ 気になる最上位のFX-8150の性能ですが、Core i7 2600Kには及ばない感じでしょうか。ちと厳しい印象です。あと、当初は水冷クーラー同梱版（￥33,800）が500セット限定販売で、その後の出荷は未定だそ…

2011-10-06

米長会長vsボンクラーズ

コンピュータ将棋

http://info.nicovideo.jp/shogi/ 来年1月14日（土）に対局らしいです。ニコニコ動画で中継するらしいんで、現地には行けませんがそっちで見ようと思います。にしても、今後のプロとの対局はあからの出番かと思ってたんで、ボンクラーズ単体ってのは意外で…

2011-10-05

ちょっと進展した、かも

開発日記

19:42:33 @ core::rl::GameAggregator::aggregate() > 3局終了 19:42:33 @ core::rl::GameAggregator::aggregate() > +---+---+---+---+---+---+---+---+---+ 19:42:33 @ core::rl::GameAggregator::aggregate() > | | | | | | | | |^杏| 19:42:33 @ core::r…

2011-10-01

うーん、そんなに悪くないよなぁ

開発日記

23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 終局図 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |^杏| |v銀|^飛| |^龍|v銀| | |…