GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2011-10-01から1ヶ月間の記事一覧

Gasyou_Atom-D510_2c4tが不安定

何か、今日になってから一気に不安定になった気が… 思考時間制御入れただけなんだけど、どこが原因かなぁ…

ひよこ将棋さんに負けてる

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/10/21/wdoor+floodgate-900-0+hiyoko_shogi_v0.05_1t2m+Gasyou_Atom-D510_2c4t+20111021040002.csa やばい、もうすぐ追いつかれるかも…

思考時間延長と指し手変化率

1票 2票 3票 4票 1秒→5秒での変化確率 0.80137 0.563751 0.360679 0.12433 1秒→25秒での変化確率 0.806897 0.615303 0.400862 0.165746 出現確率 0.0521327 0.324983 0.256601 0.342925 GA将!!!!!とsspとの連続対戦の棋譜から、思考時間を1秒→5秒→25秒と延長…

持ち時間5分でのsspとの対局結果

105-2-73で勝率59.0%。95%信頼区間は51.4〜66.3。持ち時間が長いとssp有利になるんでしょうかね。 とりあえず思考時間制御を入れて、この結果を上回るのが当面の目標ですね。

ひよこ将棋さんには何とか勝てる

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/10/20/wdoor+floodgate-900-0+hiyoko_shogi_v0.03_1t2m+Gasyou_Atom-D510_2c4t+20111020083002.csa 53手目6二金打にはちょっと焦りましたが、その後は何とか対処して勝てました。 てか、駒割+全幅探索だけ(…

LMRの乱数範囲調整

昨日のコードから、lmrOffset2ndを1.5〜3.0に修正したバージョン。 対sspで110-0-69、勝率61.5%。95%信頼区間は53.9〜68.6。 やっぱり修正前の方が良い結果なんで、この変更は破棄します。

探索深さと思考時間増加の関係

GA将!!!!!対sspの棋譜から一手30秒で探索し、探索深さの増加と思考時間の増加割合を調べてみました。 んで、結果は上のグラフの通り。序盤は1手で3倍、終盤は1手で4〜6倍って感じだと思います。

一個上のデータ

とりあえず一局分のデータが出ましたが、1手深く読むと大体思考時間が3倍になってます。 …小さすぎる様な気が。どっかで1手で5倍ってデータ見た様な気がするんですが。 うーん、データ収集コードのどっかがバグってる?

思考時間制御に着手

…の前に、基本的なデータが必要なのでそっちの収集コードを実装。 とりあえず、一手深く読むと思考時間が何倍になるかを調べてみます。 んで、次は合議ありで浅く読んだ時の最善手の票数と、更に深く読んだ時の最善手の変化確率を調べて、それが完了したら思…

今朝からの連続対局の結果

http://d.hatena.ne.jp/Gasyou/20111019/1318979427で書いた設定です。 結果、95-0-51で勝率65.1%。95%信頼区間は56.7〜72.8。 前の方が良さそうなんで、変更部分は元に戻します。

Rが一気に下がってる

pishogi戦で異常終了して負けて、それで一気に下がった様です。 lesserpyon_sakura_vps_testやgps500と当たらないとR回復しなさそうですが、なかなかその辺とは対局組まれないですし… てか、pishogiに勝って上位に負けての繰り返しですね。うーん…

LMRパラメータの乱数化を変更

今現在、LMRで短縮する深さを計算するルーチンは下記の様になっていて、"lmrなんちゃら"というパラメータ5個を乱数で初期化しています。 double AlphaBetaSearcher2::calcLmrOffset( const size_t depth, // 探索深さ const size_t rank, // 先頭から何番目…

昨夜からの連続対局結果

LMRパラメータの乱数初期化は元のコードのままで、勝敗読み切った場合はすぐ指す様にだけ修正したバージョン。 結果、120-3-50で勝率70.6%。95%信頼区間は63.1〜77.3。昨日の昼間の結果とほぼ同じなんで、エンバグしてるってコトは無さそうです。

Gasyou_Atom-D510_2c4tが不安定

参戦直後からちょくちょく落ちてますが、なんなんだろう… どうも、終盤の詰将棋ルーチン動作時に問題がありそうな気がしますが、それも確証無いですし… とりあえず詰将棋ルーチンを外して様子を見てみます。

LMRのパラメータを乱数で初期化しての合議

今朝からsspと対局させてて、その結果。 99-1-47で勝率67.8%。95%信頼区間は59.6〜75.3。初期化無しの合議より強くなっている確率は62%。 乱数の範囲が適当過ぎたかもしれないんで、その辺いじって今夜一晩対局させてみます。 それから、評価値が「ほぼ勝…

8:00の回から合議バージョンを投入

Gasyou_Atom-D510_2c4tってヤツです。 んで、マシンの都合上InaniwaShogi_Atom-D510_1cは参戦中断します。GA将!!!!!の方で4スレッド使い切っちゃうんで、他のソフトを動かしている余裕は無いんで。 初戦はpishogiさんと。これはさすがに勝つでしょう

連続対戦結果(一晩分)

対sspで1手1秒、GA将!!!!!側は1クライアントでの合議と4クライアントでの合議。 結果、1クライアントだと139-2-79で勝率63.8%、95%信頼区間は57.0〜70.1。4クライアントだと80-3-41で勝率66.1%、95%信頼区間は56.9〜74.5。 礒部さんの勝率検定補助ツール…

バグ修正出来たかも

合議関連ではなく、αβ探索自体のバグでした。 で、元々バグはあったが顕在化しにくい状態*1だったんですが、それが合議対応でαβの処理を少しいじった時に表面に出て来たみたいです。 修正してsspと連続対戦中ですが、現在20-0-11。まだ何とも言えませんが、…

続・シングルエンジンでの強さ

10/15のソース*1からビルドしたものと、最新版で1クライアントの合議にしたものをsspと連続対戦させてみました。 結果、前者は169-3-129で勝率56.7%、95%信頼区間は50.9〜62.4。後者は108-2-94で勝率53.5、95%信頼区間は46.3〜60.5。 合議実装前の結果(…

シングルエンジンでの強さ

合議*1を実装したんですが、どうにも弱いです。具体的に言うと、ssp相手に勝率6割行くか行かないか位。 んで、試しにクライアント数1での合議(これは、合議無しと同じ動作になるはず)と合議無しの2パターンでsspと対局させてみました。条件は前と同じで、1…

旧評価関数を使える様にしました

んで、ちょっとインタフェースが変わったので、弱くなってないかテスト。 条件は旧評価関数(前回選手権時のパラメータ)+現行の探索ルーチン。対局相手はsspで一手一秒*1。 結果、43-0-21で勝率67.2%。95%信頼区間は54.3〜78.4。対局数少ないんではっき…

合議中心にスケジュールを再構築

選手権まで残り201日。微妙に切羽詰まって来ました。 という訳で、思い切ってスケジュール変更。学習は一旦保留します。 シグモイド関数無しでの方策勾配法 実装は完了。現在テスト中。 レポート収集系の整理 パラメータのセーブ・ロードまわりのテスト ※問…

選手権まで残り202日

な訳ですが、学習の方は全く進展無し。ブログにはまだ書いてないけど、裏でゴチャゴチャやってるんですが、それもちょっと微妙な感じですし(これに関しては後日書きます)。 んで、さすがに2年連続で出ないのもなんですし、学習意外でちょっと改良してみよ…

AMD FX-series発表

http://www.4gamer.net/games/100/G010000/20111012001/ 気になる最上位のFX-8150の性能ですが、Core i7 2600Kには及ばない感じでしょうか。ちと厳しい印象です。 あと、当初は水冷クーラー同梱版(¥33,800)が500セット限定販売で、その後の出荷は未定だそ…

米長会長vsボンクラーズ

http://info.nicovideo.jp/shogi/ 来年1月14日(土)に対局らしいです。 ニコニコ動画で中継するらしいんで、現地には行けませんがそっちで見ようと思います。 にしても、今後のプロとの対局はあからの出番かと思ってたんで、ボンクラーズ単体ってのは意外で…

ちょっと進展した、かも

19:42:33 @ core::rl::GameAggregator::aggregate() > 3局終了 19:42:33 @ core::rl::GameAggregator::aggregate() > +---+---+---+---+---+---+---+---+---+ 19:42:33 @ core::rl::GameAggregator::aggregate() > | | | | | | | | |^杏| 19:42:33 @ core::r…

うーん、そんなに悪くないよなぁ

23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 終局図 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |^杏| |v銀|^飛| |^龍|v銀| | |…

対局開始から50手だけ学習して囲う現象

どうも再現出来たっぽいです。 という訳で、今度は終盤まで学習して囲わない現象の原因究明が当面の目標になりました。 さーて、どっから手を付けたもんかなぁ…

上記のバグですが

バグじゃなかった様です。 どうも、テスト用コードに問題があったらしく、テスト用コードを書き換えるとちゃんと棋譜の手の選択確率が1.0に収束しました。 …このバグ潰せば一気に上手く行くかと思ってましたが、どうもそう甘い状況でもないらしいです。

昨日書いたバグ

これの件ですが、当初は進行度絡みのバグ(棋譜以外の手が進行度上がる手なので、棋譜の手のパラメータ修正が棋譜以外の手により大きく影響している)かと思ってたんですが、どうも違う様です。進行度を0.5固定にしても再現しましたので。 まぁ、進行度絡み…