GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2014-03-01から1ヶ月間の記事一覧

あう…

ssp相手に52-0-25。明らかに弱くなってる_| ̄|○ 全幅1手のデータを引き継ぎではこの辺が限界っぽいんで、最初から全幅2手での学習を開始します。 それから、14:30の回からCore i7 940マシンでfloodgateに参戦します。マシンスペックの差がどの程度棋力に影…

昨夜からの連続対戦結果

対sspは72-0-28。対Bonanza 6.0(3手読み)は60-0-40。 微妙に弱くなってる様な… まぁ、もうちょっと様子見しますか。

っしゃ!! ようやく1勝。

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2014/03/26/wdoor+floodgate-900-0+gps500+Gasyou_Atom-D510_1c2t+20140326213001.csa 時間ギリギリでヤバかったですが、何とかgps500に勝てました。 ただ、ssp相手の連続対戦は結果がちょっと… 現在25-0-11で、直…

っえ〜〜?

こんな手順で勝っちゃっていいのかよ… なんか、一晩たったら凶暴さに磨きがかかってる気がするんですが… V2.2 N+Gasyou7 N-ssp P1-KY-KE-GI-KI-OU-KI-GI-KE-KY P2 * -HI * * * * * -KA * P3-FU-FU-FU-FU-FU-FU-FU-FU-FU P4 * * * * * * * * * P5 * * * * * *…

選手権までにすべき事

例によって優先度順で。 新アルゴリズムでの学習(継続して実施)。 進行度計算ルーチンの実装及び、それを用いた思考時間制御の実装(前バージョンからまるっと持って来る予定)。 詰んだ場合の挙動の修正(可能な限り短手順で詰む手を指す)。 複数評価関…

合法手が1手しか無い場合にノータイムで指すべきか

現状のGA将!!!!!!!は、現局面の合法手が1手のみの場合、ノータイムでその手を指します。 …が、これって実は時間がもったいないんじゃないかと思って、現在対応を検討中。 考えてるプランは以下の2通り。 合法手が1手のみの場合、1.9秒位考えて*1から指す。こ…

今日の結果

ssp(本将棋モード)相手に124-0-44で勝率73.8%、95%信頼区間は66.5〜80.3になりました。 と言う訳で、望外に良い結果なのでこのパラメータでfloodgateに投入します。目指せ、gps500に一勝!! んでもって、今夜からはsspとBonanza 6.0 3手読みの2エンジン…

よ〜し、そのままそのまま

割とイイ感じに学習が進んでいる様です。 現在ssp(本将棋モード)相手に101-0-39。勝率72.1%の95%信頼区間は63.9〜79.4。 何か、全幅2手にしてから攻めっけが強くなったというか、凶暴になったというか、そんな感じです。 とりあえずもうちょっと学習が進…

え〜

floodgateは最下位を絶賛独走中です。 んで、spp(本将棋モード)相手は137-0-89で勝率60.6%、95%信頼区間は53.9〜67.0。あ、全幅1手で学習した結果です。 さて、次は全幅1手のパラメータを引き継いで、全幅2手で3万7千局学習したパラメータで連続対戦させ…

復帰しました

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou_Atom-D510_1c2t%2Bd798a38aa2283a02f5b8e2f832b98162 まだ本将棋でsspと互角程度ですが、テストも兼ねて復帰。 当面はgaryuさ…

Haswell-E・Broadwellの情報

http://news.mynavi.jp/news/2014/03/20/055/ 気になる情報としては、Haswell-Eが8コア・DDR4対応で今年後半に登場(これは噂通り)、それから予定変更してBroadwellがLGA1150パッケージで登場するというものがあります。 Broadwellに関しては、これまではソ…

終盤学習の実装中

山本@ひまわりさん発案の「終盤学習」を実装・テスト中です。 深い探索(通常探索もしくは詰将棋ルーチン)で得た詰みの手順を、浅い探索の教師として(浅い探索でも同じ手を指せる様に)学習させる、というものです。 んで、実際に動かしてみると、金の価…

VS spp(5五将棋モード)

合議用の一番「軽い」設定の評価関数(駒割+絶対位置評価+王将周辺の利きの評価のみ)で80万局学習させてみました。 んで、結果は448-0-171で勝率72.4%。95%信頼区間は68.7〜75.9。 そこそこ良い結果なんで、評価項目を削っても合議で使うには問題無さそ…

お、意外と強い?

ssp(本将棋モード)と対局中なんですが、現時点で26-1-20で勝ち越してます。 「明確にsspを超えたと」は言えませんが、そこそこ強くはなっている様です。 と言う訳で、パラメータを最新のもの(2日かけて38万局弱自己対戦したやつ)に差し替えて一晩スパー…

VS ssp(本将棋モード)

Lesserkaiに20連勝出来る様になったので、sspとやらせてみました。 改良型PGLeafで27万局弱学習したパラメータでの結果。 んで、結果。44-2-92で勝率32.6%。95%信頼区間は24.6〜40.9。 まだ収束していない段階でこの結果ですから、まぁ割と希望が持てそう…

↑のバグ

浮動小数点演算の精度がらみの問題でした。 …バグなら強くなるきっかけになったのになぁ…

LMRに潜在バグ?

何か、Null-Window Search中にウィンドウサイズが変に大きくなってるみたいです。 …今更かよ。何年潜んでたんだろう、このバグは?

嘘と本当と素人の誤解

前書き え〜、某イベントの某開発者の行動について色々話が出ていますが、コンピュータ将棋の開発者として一点だけ書きたい事があるので書いてみます。 内容は「評価関数を変更せずに、探索ルーチンだけ変えたから棋力は変わらないはず」*1という発言につい…

VS ssp(5五将棋モード)

改良型PGLeafで45万局学習したパラメータでの結果。 対局数は少ないですが、64-0-11で勝率85.3%。95%信頼区間は75.3〜92.4。 オペミスでパラメータファイルをロストしたんでこれ以上の対局は無理ですが、まぁ割と良い結果なので良しとしましょう。 んでも…

ここらでABC探索を実装すべきか?

全幅探索ベースで探索の延長・短縮を入れるのは手間がかかるから、それならABC探索一本槍の方が自分にはやりやすいかも。 んでもって、自己対戦学習時もABC探索を使えば多少は高速化出来るかもしれないし。 ただなぁ、ABC探索は妙な水平線効果が頻発する感じ…

ぬぅ。。。

Null-Move Pruningの挙動が怪しい。 適当に枝刈り有り・無しの場合の一致率を計測するとNull-Move有りでも一致率90%位なのに、対局させると妙に弱い。 …Null-Move外して、探索の延長・短縮はLMRのみってのが当面はベストかな。 ちなみに現在は、ssp相手に5…

近況

えー、ブログ更新は久しぶりですが、ステルスモードで開発していてfloodgateのRが3000を超えてウハウハ…なんて事も無く、平常運転です。 んで、http://d.hatena.ne.jp/Gasyou/20140222/1393041311 で書いた-1%の誤差ですが、どうも計測ルーチンのバグだった…