GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2011-01-01から1年間の記事一覧

ひよこ将棋さんに追い付かれそう

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/LATEST/players-floodgate14.html floodgateの2週間レーティングで、GA将!!!!!は1782、ひよこ将棋さんは1747。もう、ほとんど同じ強さですね。 序盤でのiterationが13手程度(15分設定にて)、終盤で9手程度回るよう…

思考時間制御は割と良い感じ

実装前の結果だと105-2-73で勝率59.0%だったんですが、現在の途中経過では69-0-23で勝率75%。ほぼ確実に強くなってます。 floodgate見てると割とちゃんと持ち時間使い切りますし、それなりの形にはなっているかと。 …問題は、レーティングがあんまり上がっ…

ライバル不在のままCore i7-2700K発売

http://akiba-pc.watch.impress.co.jp/hotline/20111029/etc_intel.html AMD FX-8150はショップブランドPCでしか入手出来ないみたいですし、単品販売はどうなるんでしょうねぇ。 2700Kの方は、2600K比で通常時・ターボブースト時共に100MHzアップですし、順…

バグ、ようやく取れたかも

floodgateで一晩たってもエラー発生してないんで、多分大丈夫なハズ。 原因は、おそらくスレッドの優先度です。 まず、現在のGA将!!!!!では探索用スレッドが5つあり、合議クライアントが通常探索を行うスレッドが4つ。これはアフィニティマスク設定で特定論…

今までやった分を反映

シグモイド関数無しでの方策勾配法 実装は完了。現在テスト中。 レポート収集系の整理 パラメータのセーブ・ロードまわりのテスト ※問題無し NumericVectorクラスの高速化(プロファイルとって、学習が高速化出来そうなら着手) ※遅くなったんで断念 将棋用…

Atomマシンのエラーチェック

floodgate参戦用のAtomマシンに何か問題があるかと思い、Memtest86+・Windowsのメモリ診断ツール・Prime95でチェックしてみましたが、どれも問題無し。 負荷かけてる時にCPU温度を見てみましたが、熱暴走している雰囲気もありませんでした。 となると、どこ…

再現しねぇ…

開発用マシンでfloodgateに参戦してたんですが(Gasyou_Core-i7-940_2c4t)、Atomマシンで起きてたエラーが再現しないです。 となると、AtomマシンのハードウェアなりOSなりの問題か?

Gasyou_Atom-D510_2c4tが不安定

何か、今日になってから一気に不安定になった気が… 思考時間制御入れただけなんだけど、どこが原因かなぁ…

ひよこ将棋さんに負けてる

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/10/21/wdoor+floodgate-900-0+hiyoko_shogi_v0.05_1t2m+Gasyou_Atom-D510_2c4t+20111021040002.csa やばい、もうすぐ追いつかれるかも…

思考時間延長と指し手変化率

1票 2票 3票 4票 1秒→5秒での変化確率 0.80137 0.563751 0.360679 0.12433 1秒→25秒での変化確率 0.806897 0.615303 0.400862 0.165746 出現確率 0.0521327 0.324983 0.256601 0.342925 GA将!!!!!とsspとの連続対戦の棋譜から、思考時間を1秒→5秒→25秒と延長…

持ち時間5分でのsspとの対局結果

105-2-73で勝率59.0%。95%信頼区間は51.4〜66.3。持ち時間が長いとssp有利になるんでしょうかね。 とりあえず思考時間制御を入れて、この結果を上回るのが当面の目標ですね。

ひよこ将棋さんには何とか勝てる

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/10/20/wdoor+floodgate-900-0+hiyoko_shogi_v0.03_1t2m+Gasyou_Atom-D510_2c4t+20111020083002.csa 53手目6二金打にはちょっと焦りましたが、その後は何とか対処して勝てました。 てか、駒割+全幅探索だけ(…

LMRの乱数範囲調整

昨日のコードから、lmrOffset2ndを1.5〜3.0に修正したバージョン。 対sspで110-0-69、勝率61.5%。95%信頼区間は53.9〜68.6。 やっぱり修正前の方が良い結果なんで、この変更は破棄します。

探索深さと思考時間増加の関係

GA将!!!!!対sspの棋譜から一手30秒で探索し、探索深さの増加と思考時間の増加割合を調べてみました。 んで、結果は上のグラフの通り。序盤は1手で3倍、終盤は1手で4〜6倍って感じだと思います。

一個上のデータ

とりあえず一局分のデータが出ましたが、1手深く読むと大体思考時間が3倍になってます。 …小さすぎる様な気が。どっかで1手で5倍ってデータ見た様な気がするんですが。 うーん、データ収集コードのどっかがバグってる?

思考時間制御に着手

…の前に、基本的なデータが必要なのでそっちの収集コードを実装。 とりあえず、一手深く読むと思考時間が何倍になるかを調べてみます。 んで、次は合議ありで浅く読んだ時の最善手の票数と、更に深く読んだ時の最善手の変化確率を調べて、それが完了したら思…

今朝からの連続対局の結果

http://d.hatena.ne.jp/Gasyou/20111019/1318979427で書いた設定です。 結果、95-0-51で勝率65.1%。95%信頼区間は56.7〜72.8。 前の方が良さそうなんで、変更部分は元に戻します。

Rが一気に下がってる

pishogi戦で異常終了して負けて、それで一気に下がった様です。 lesserpyon_sakura_vps_testやgps500と当たらないとR回復しなさそうですが、なかなかその辺とは対局組まれないですし… てか、pishogiに勝って上位に負けての繰り返しですね。うーん…

LMRパラメータの乱数化を変更

今現在、LMRで短縮する深さを計算するルーチンは下記の様になっていて、"lmrなんちゃら"というパラメータ5個を乱数で初期化しています。 double AlphaBetaSearcher2::calcLmrOffset( const size_t depth, // 探索深さ const size_t rank, // 先頭から何番目…

昨夜からの連続対局結果

LMRパラメータの乱数初期化は元のコードのままで、勝敗読み切った場合はすぐ指す様にだけ修正したバージョン。 結果、120-3-50で勝率70.6%。95%信頼区間は63.1〜77.3。昨日の昼間の結果とほぼ同じなんで、エンバグしてるってコトは無さそうです。

Gasyou_Atom-D510_2c4tが不安定

参戦直後からちょくちょく落ちてますが、なんなんだろう… どうも、終盤の詰将棋ルーチン動作時に問題がありそうな気がしますが、それも確証無いですし… とりあえず詰将棋ルーチンを外して様子を見てみます。

LMRのパラメータを乱数で初期化しての合議

今朝からsspと対局させてて、その結果。 99-1-47で勝率67.8%。95%信頼区間は59.6〜75.3。初期化無しの合議より強くなっている確率は62%。 乱数の範囲が適当過ぎたかもしれないんで、その辺いじって今夜一晩対局させてみます。 それから、評価値が「ほぼ勝…

8:00の回から合議バージョンを投入

Gasyou_Atom-D510_2c4tってヤツです。 んで、マシンの都合上InaniwaShogi_Atom-D510_1cは参戦中断します。GA将!!!!!の方で4スレッド使い切っちゃうんで、他のソフトを動かしている余裕は無いんで。 初戦はpishogiさんと。これはさすがに勝つでしょう

連続対戦結果(一晩分)

対sspで1手1秒、GA将!!!!!側は1クライアントでの合議と4クライアントでの合議。 結果、1クライアントだと139-2-79で勝率63.8%、95%信頼区間は57.0〜70.1。4クライアントだと80-3-41で勝率66.1%、95%信頼区間は56.9〜74.5。 礒部さんの勝率検定補助ツール…

バグ修正出来たかも

合議関連ではなく、αβ探索自体のバグでした。 で、元々バグはあったが顕在化しにくい状態*1だったんですが、それが合議対応でαβの処理を少しいじった時に表面に出て来たみたいです。 修正してsspと連続対戦中ですが、現在20-0-11。まだ何とも言えませんが、…

続・シングルエンジンでの強さ

10/15のソース*1からビルドしたものと、最新版で1クライアントの合議にしたものをsspと連続対戦させてみました。 結果、前者は169-3-129で勝率56.7%、95%信頼区間は50.9〜62.4。後者は108-2-94で勝率53.5、95%信頼区間は46.3〜60.5。 合議実装前の結果(…

シングルエンジンでの強さ

合議*1を実装したんですが、どうにも弱いです。具体的に言うと、ssp相手に勝率6割行くか行かないか位。 んで、試しにクライアント数1での合議(これは、合議無しと同じ動作になるはず)と合議無しの2パターンでsspと対局させてみました。条件は前と同じで、1…

旧評価関数を使える様にしました

んで、ちょっとインタフェースが変わったので、弱くなってないかテスト。 条件は旧評価関数(前回選手権時のパラメータ)+現行の探索ルーチン。対局相手はsspで一手一秒*1。 結果、43-0-21で勝率67.2%。95%信頼区間は54.3〜78.4。対局数少ないんではっき…

合議中心にスケジュールを再構築

選手権まで残り201日。微妙に切羽詰まって来ました。 という訳で、思い切ってスケジュール変更。学習は一旦保留します。 シグモイド関数無しでの方策勾配法 実装は完了。現在テスト中。 レポート収集系の整理 パラメータのセーブ・ロードまわりのテスト ※問…

選手権まで残り202日

な訳ですが、学習の方は全く進展無し。ブログにはまだ書いてないけど、裏でゴチャゴチャやってるんですが、それもちょっと微妙な感じですし(これに関しては後日書きます)。 んで、さすがに2年連続で出ないのもなんですし、学習意外でちょっと改良してみよ…