GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

floodgate

C2D-P8600参戦終了

Rは1500後半で落ち着いたんで、多分これ位が本当のRなんでしょう。 となると、Atom-D510とのR差は200ちょいで、これがマシンスペックの差の分ですね。意外とあります。

選手権用のノートPCで参戦

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou4_C2D-P8600_2c%2B32b72b907b9de039016540368bce458d 今日メモリを4GBに増設したんで、テストも兼ねて参戦中。しばらくしたら引…

強かったパラメータのサルベージ、出来たかも

昨夜から対sspの連続対戦を走らせてて、243-5-116で勝率67.7%。 ちょっと思い付いて、2009/12/11版のパラメータと2009/12/12版のプログラムを組み合わせてみたんですが、どうも現在のプログラムより強くなってたみたいです。 本当に強さが違うのかは、今夜1…

ABC探索の実装は一時中断

とりあえず評価関数をちゃんとしてから探索をいじる事にしました。あと、ABC探索は私にはまだ早いかも。 んで、二駒絶対位置関係の評価の差分計算がバグっていたのを修正…出来ませんでした。バグの原因らしきものは見当付いたんですが、肝心の対策がまだ。 …

新パラメータを投入

簡易版ボナメソ部分の学習率を低めにしたら上手く行ってる感じなので、ここらでfloodgateに投入。 なんか、四間飛車大好き&苦手になったみたいですが、勝てるのか、これで? ちなみにssp相手の連続対戦は現在28-0-24で勝ち越し中。一晩走らせてみて、順調そ…

新パラメータ投入

簡易版ボナメソ+自己対戦のパラメータがそこそこ強くなってるみたいなので、floodgateに投入。22:00の回からです。 まぁ、まだまだ学習途中なので色々荒削りですし、floodgateでは負けまくると思いますが。 ssp相手の連続対戦は今のところ16-0-16。正確な勝…

簡易版ボナメソのパラメータをfloodgateに投入

現在4連敗中。とりあえず一晩様子見ます。 学習用マシンではパラメータ引継ぎで自己対戦学習を開始。今のパラメータをベースに強くなってくれれば、ってとこですが、果たしてどうなるのか。

今floodgateに投入しているパラメータですが

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou_Atom-D510_1c2t%2Bedd1a7ba7a36303c69262a79f81d0a78 vs sspの勝率が14.7%でした。低すぎ。こりゃ弱いはずです。 てか、最近…

pishogiに負けてる

http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2F%2F2009%2F12%2F16%2Fwdoor%2Bfloodgate-900-0%2BGasyou%2Bpishogi%2B20091216053007.csa 原因は二つあって、こいつらが同時に発…

gps500にtime upで負けてると思ったら

負けが確定した時点でバグって発狂してました。 まぁ、放置してもどうせ負けなんで問題無いんですが、みっともないので対策しました。あと、連続対戦が止まると困るし。 んで、Rは1300突破目前。いい感じです。

評価項目を追加&色々

まずはプログラムの修正内容。 千日手の評価値の扱いがいい加減だったのを修正。学習時と対局時で値を使い分ける様に。 筋段個別の絶対位置評価を追加。 二つ目は旧バージョンに実装していて新バージョンには無かったもので、駒の絶対位置評価を筋だけ見てや…

floodgateに復帰しました

あんまりにも成果が出ないので、気分転換にfloodgate復帰。 …早速まったりゆうちゃんとgps500にボコられましたorz yowai_gps_pieceはいないみたいですし、当分は誰にも勝てずにR下がりまくりかも。

VS ssp 七晩目

252-0-171で勝率59.6%、95%信頼区間が54.7〜64.3。 一日ごとに強くなったり弱くなったりしてるのが気になりますね。 気になるんですけど、どうせ時間かけるなら新バージョンの開発を進めたいですし、今の学習条件だと強さはこれ位が上限っぽいので、ここで…

新パラメータを順次投入

学習用マシンで学習させたパラメータを定期的にfloodgate参戦用マシンに書き込み、floodgateでは常に最新のパラメータを使用する様に変更。 これに伴い、学習初期のレーティングの変化を見たいので、学習はパラメータを引き継がずに最初からやり直し。 多分…

新パラメータ投入

以前の評価項目・探索のままで、対局数を約500万まで増やしたもの。 正直あまり期待してないのですが、今日から1週間ほどは学習用マシンで別条件の学習をさせるので、とりあえず現時点の最新バージョンのパラメータを投入してみました。

新パラメータ投入

22:30の回からパラメータファイルを差し替えたものを投入。評価項目は以前と同じで、対局数を400万強まで増やしたもの。 ローカルでLesserkaiと一戦した感じだと、私には強くなってるかどうか判断に苦しみます。という訳で、投入してみてRの変化を見てみたい…

新バージョン投入

21:00の回から新バージョンを投入します。 最大の変更点は評価関数の処理で、今までは特徴の線形和をシグモイド関数を通してから評価値としていたのを、線形和そのままにしました。 ここのシグモイド関数の処理は強化学習が上手く行ってない時に入れたのです…

昨日投入したパラメータ

以前のよりRが+40〜50って感じみたいです。意外と伸びませんでしたね。 今は学習用マシンでちょっと違うバージョンを動かしてるんで、数日後にはそっちのパラメータに差し替えるかもしれません。

かずさんの秘蔵っ子?

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=fatechan%2B3ab4c5c1f48e577aac9951cef3ed4351 fatechanというソフトが昨夜一局だけ指していますが、ひょっとしてNanohaWCSC19の後継…

なにがあったNanohaWCSC19

レーティングが一気に下がってます。も、目標にしてたソフトが落ちてきたら、私はどうすれば(汗 とりあえず今日の再参戦は無し。ひょっとしたら明日やるかもです。

なのはさんがfloodgate参戦

http://vivio.blog.shinobi.jp/Entry/100/ 5/11現在のRはGasyouより100位上。まずはNanohaWCSC19に追い付くのが目標ですね。 という訳で、明日か明後日にでも再参戦します。パラメータはこの間からの学習中のがあるので、とりあえずそれを投入予定。

王手千日手

13時の回の対gps_l戦がGA将!!!の王手千日手負け負けだったんですが、そうしないと自玉が詰んで負けるって状況だったみたいですね。 今は、王手千日手の評価値は「負け+100」で、詰んだら「負け+詰め上がりまでの手数」になってるんで、王手千日手で負けた…

昨夜から参戦中

現在レーティング1200チョイって所です。前のオープン戦で手も足も出なかったtohskeに追い付いた?*1 それから、読み筋が変だったんでパラメータファイルを確認したら、4/9のかなり古いファイルでした。これではダメダメなんで、学習用マシンでの最新ファイ…

Lesserkai相手に23勝0敗0分け

という訳で、今朝のパラメータ+ちょっと修正したプログラムでfloodgateに復帰。修正内容は乱数を少し大きく*1しただけです。 それから、学習用マシンには評価項目を増やしたバージョンをパラメータ持ち越しで投入。今の項目はこんな感じです。 駒割 絶対位…

探索内での乱数の計算方法変更

2/28日のコメント欄でid:ak11さんに教えて貰った方法(テーブルからハッシュコードを使って乱数を持ってくる)を実装。一局ごとにテーブルを初期化し直してるんで、多分同一手順を回避出来るはずです。 んで、評価項目を基本的なのに絞ったらそれなりにちゃ…

ぷよぷよみたいに、4つそろうと消えればいいのに

色々リセット

まず、プログラムは打ち歩詰めと思考時間関連の修正が完了。 ローカルでテストして大体動いてるんで、floodgateに投入。パラメータは昨日までと同じなので、単純にプログラムが変わっただけ。 それから、今日まで学習させた結果を見ても、やっぱりどっか変で…

ponanza_testに切れ負けしてる

やっぱり探索打ち切りをもうちょっとちゃんとしないと。

floodgate参戦

初戦はponanza_testだったのですが、通信エラー後にこちらの時間切れ負けになりました。すいません>山本さん んで、エラーの原因はなんなのか… こういうのは苦手です。