2010-07-01から1ヶ月間の記事一覧
昨日からのシングルスレッド・非合議バージョンの結果。 428-?-511で勝率45.6%。95%信頼区間は41.8〜49.1。 となると、並列化で勝率+15%、合議だと+30%ってとこですね。 今夜は多数決合議と同じ乱数設定で、複数評価関数の方を走らせてみます。
548-?-186で勝率74.7%。95%信頼区間は71.3〜77.8。ようやく並列化バージョン(約60%)の勝率を超えれました。 んで、基礎データとしてシングルスレッド・非合議バージョンの勝率が欲しいので、今夜はそれを動かしてみます。
試しに評価値に乱数を足す方式の多数決合議*1を実装してみたんですが、ssp(5五将棋モード)相手に504-?-469で勝率51.8%。単体で60%は行ってたんで、単純に並列化した方が強いですね。 ただ、今回は正規乱数の標準偏差が0.1だったんで、評価値が大体1.0〜-…
確か3日半位学習させたやつです。まぁ、望み薄ですが。
試しにUSIで指示された秒読み時間の8倍考える様にして、各弱エンジン*1の使うCPU時間を非合議・並列化バージョンと同じにして連続対局させてみました。これで弱くなってるなら、弱いパラメータの評価関数が足を引っ張ってるって事になります。 んで、結果。2…
http://journal.mycom.co.jp/news/2010/07/26/002/index.html 下の方のキャッシュトポロジーの図ですけど、色々バケモノw L1が命令64KB・データ128KBでL2は1.5MB(ここまでコアごとに占有)。この辺まではまぁ割と常識的な値ですが、L3が24MB共有でL4がなん…
合議用に学習した評価項目全部入りのパラメータファイルで、評価関数は古い実装のもの。 んで、結果は247-?-164で勝率60.1%。95%信頼区間は55.2〜64.9。 新しい実装だと五分五分位だったので、誤差以上に強くなってる感じです。 う〜ん、どっかバグってる…
66-?-276で勝率19.3%。弱すぎるw 以前の結果だと、合議無しでTDLeaf(λ)で学習すると勝率80%位だったんで、最低でもこれを上回らないと意味が無いです。 という訳で今から弱くなってる理由を調査してみます。
色々あって、多分次回選手権にはCore i7 940で参戦します。 んで、来年夏頃にSandy Bridgeで開発用マシンのCPU・マザー・メモリ等を更新。今のCPUとかはそのままキャプチャ用マシンにスライド。 冬頃にはSandy BridgeベースのXeon DPが出る予定なので、学習…
非っ常〜に不可解な現象が起きてましたが、とりあえず原因は判明したんでちゃんと対処。 それから、本将棋だと学習に時間がかかるので、学習用マシンには5五将棋モードで投入。これなら一晩で学習完了する、はず。
学習時にPV末端まで進める処理の最中に差分計算した評価値が一から計算した評価値と一致しないという、ちょっと前に見つけたバグ。PV末端まで進める前に差分計算の初期化コードを書いたら、何故か起きなくなりました。 原因が不明なのが気持ち悪いんで、今夜…
見てるとお見合いしての引き分けが多いので、対局開始から4手はランダムに指す様に変更。これで引き分けは減るはずですし、学習がちゃんと進んでくれないかなぁ。
86-2-306で勝率21.9%。95%信頼区間は17.9〜26.4。以前よりはちょっと向上しました。 まだ4日しか学習させていないので、もうちょっと時間をかけて様子を見ます。
http://akiba-pc.watch.impress.co.jp/hotline/20100717/etc_intel.html 8万5千円は高すぎでしょう… 買えねぇっすよ。
ssp相手に29-4-230で勝率11.2%。floodgateでも負けまくり。 学習不足かもしれないんでもうちょっと様子を見ます。
それなりに強くはなってるみたいです。今夜はsspとの連続対局をさせる予定。
Lesserkai相手だとそこそこ戦える様になってきたので(現在8-0-0)、ちょっと時期が早いかもしれませんがfloodgateに投入します。20:30の回から参戦予定。
どうも、駒の絶対位置評価の差分計算まわりにバグがある感じです。 今日はもう時間がないのでとりあえず差分計算をオフにして凌ぎますが、今週末にでもちゃんと調査してみます。
http://a96sj096.cocolog-nifty.com/weblog/2010/07/intelsandy-brid.html 時期等は明言されていませんが、従来のスケジュールより早く出てくる可能性もある様です。 …となると、Xeon DPのラインナップに8コアが入ってくる時期も早まる? 慌てて6コアXeon買…
やっぱり二駒相対の差分計算まわりでした。しかも、イヤになるほど単純なバグ。穴があったら入りたいデス。 という訳で、修正後のバージョンを学習用マシンに投入&開発用マシンではアサーション有効で走らせときます。
二駒相対が有効だと、駒割のパラメータすら変な値になってる。他のは見てないけど、指し手を見る限りだとかなり変な値になっていると思われます。 んで、私のカンが差分計算まわりのバグだと言ってるんで、その辺から見てみます。
基本的には評価関数ごとにパラメータファイルを分けたりとかそういう細かい所なので、あんまりつまずかずに完成。現在学習中。 明日か明後日には収束するでしょうから、そうしたらfloodgateに投入します。
多数決合議の思考ルーチン部分は完了。学習部分は未完成。 今の学習用マシンはCore i7で8スレッドなので、評価関数も8通り用意しました。 二駒の相対位置関係 王将の移動可能な範囲 駒の自由度 の3つの評価項目それぞれのオン/オフの組み合わせ計8通りです…
今日はよそ事で時間喰っちゃったんで少しだけ。合議用探索ルーチンのコンストラクタとデストラクタを書きました。 あとは新評価関数に足りなかったメソッドをちょろっと追加したり、そんな感じ。 明日には合議で探索が完成する、かも。早くfloodgateに参戦し…
後は合議用の探索部分と、複数評価関数での並列学習を実装すれば完了です。 明日のうちには、探索部分だけでも出来るかもしれません。もしそうなれば、floodgateに投入してみます。
http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2Ftools%2FLATEST%2F%2F2010%2F07%2F09%2Fwdoor%2Bfloodgate-900-0%2BLesserkai%2BGasyou_Atom-D510_2c4t%2B20100709220005.csa 例によって…
とりあえず未実装の関数が11まで減りました。 主要部分の半分は終わったんで、今週末のうちには評価関数の実装完了するはずです。
「ソレなんて劣化Larrabee?」とか言わない様に。 あれば合議用に4台ほど揃えたいんですが。マジで。
例えばボナメソで学習したパラメータで4スレッド+TDLeaf(λ)で学習したパラメータ4スレッドとか。 Xeon*2で24スレッドにするなら、TreeStrap(αβ)も加えて各8スレッドとか。 …って、ボナメソのパラメータ、取ってあったっけな? 一度そこから探してみないと。
http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou_Atom-D510_2c4t%2Bb29f849aafa476371d3bc54a12b27d43 微減ですが、今までよりはっきり弱くなってる感じがします。あくまで私が…