2009-06-01から1ヶ月間の記事一覧
評価項目が駒割だけだとテストにならない部分もあるので、簡単そうな王将周辺の利きの評価を実装。 実装してみると意外と複雑で、差分計算出来るのか心配になってきました。まぁ、この評価項目はどうしても欲しい訳では無いので、速度面で問題が出そうなら使…
203-0-105で勝率68.7。95%信頼区間は63.4〜73.6。 そろそろ収束したのか? 明日の結果もこれ位なら、収束したと判断します。
291-0-191で勝率60.4。95%信頼区間は55.8〜64.8。なんか、勝率落ちてるんすけど…(汗 これが普通にあり得る変動なのかどうか気になるんで、もうちょっと続行します。
ちょっとは速くなりましたが、まぁまだデバッグモードとかで動かしてるだけなんで、ちゃんとした速度計測はまた後でやります。 他には特にブログに書く様なネタは無し。最近はこんなばっかりです。
まずは短期的な事。 History Heuristicでオーダリング。 静止探索。 もうちょっとまともな評価項目 ベンチマーク用のコード整備。 置換表。 評価項目を一通り揃える(三駒の関係以外)。 んで、次回選手権までにしたい事。 予備実験。 UCTで序盤を指すと、ど…
強化学習エージェントやら探索やら、そういう部分のバグ取りしつつダラダラ過ごす週末でした。 …なんか、最近は週末になるとだらけてる感じがしますね。こんなんじゃ来年の選手権に間にあわないっす。ピンチ。
先週末に大須行った時に、ちょっとよさげなのがあったのでメモ。エルゴヒューマンのEH-HAMってのが¥84,800。 色々調整出来て、座り心地とかも好みだったので、ひょっとしたら今度買うかも。
時間の都合上対局数は少ないですが、208-0-93で勝率69.1%。95%信頼区間は63.5〜74.3。 昨日・一昨日よりははっきり強くなったと言っていいと思います。という事は、昨日の結果はたまたま学習が停滞していたって事でしょうか。 とりあえず学習続行します。
404戦中220-0-184で勝率54.5。95%信頼区間は49.5〜59.4。 昨日とほとんど変わってない…と言うか、少し勝率落ちてます。 強くならない理由の候補はざっと三つ。 バグ 設計ミス 意外と収束が早いだけ どう考えても1か2です本当に(ry もうちょっとデータほしい…
勝敗は238-0-192で勝率55.3%。95%信頼区間は50.5〜60.1。 なんか、学習初期のパラメータの割には意外と勝率高いですね。ひょっとしたら、私が思ってたより収束するのが早いのかも*1。 んで、パラメータファイルを更新して連続対戦をリスタート。今度のは約3…
アルゴリズムの変更は無しで、使うデータの方をちょっといじっただけなので、比較的短時間で出来ました。 んで、れさぴょんと合法手の一致チェックをしてみたらちゃんと動いてるみたいですし、とりあえず修正はこれでOKでしょう。 今日はなんか疲れたんでコ…
http://pc.watch.impress.co.jp/docs/column/kaigai/20090625_296395.html 「デスクトップCPUの比較」という図だと、2010年Q2にExtremeのモデルが出て、Q3にその下(今のCore i7 950/920の位置)の2モデルが出るみたいですね。 まぁ、そういう売り方するなら…
αβ探索なのにαカット・βカットを実装していなくてMinMax探索になってたので、ちゃんとカットを実装。 それから、いまさら手の配列*1の持ち方に性能上の問題が出そうなところが見つかって、それの対処を調べつつコーディングしつつどうでもいい事で悩んだり。…
795戦して1-0-794。95%信頼区間は0〜0.7。まぁ、最初はこんなもんでしょう。 という訳でここからが本番。18万局経過バージョンのパラメータを投入してみます。
まだ開発環境を整えながらやってるので、なかなか思う様には進みません。 で、この前は学習中のパラメータをfloodgateにすぐに投入してレーティングの変化を見てみましたが、今度はsspとの連続対戦で強さの変化を見てみます。 ただ、1秒将棋だと安全にパラメ…
3. コマンド「googledesktopsetup.exe /force」を入力します。 http://desktop.google.com/support/bin/answer.py?hl=jp&answer=25631 私の環境だと、とりあえず動いてます。
とりあえずTDLeaf(λ)+αβ探索+駒割のみの評価関数でエラーが出ずに一局動かす所までは出来ました。 後はちゃんとデバッグして、その後に探索の高速化(現状では置換表もムーブオーダリングも無い)と静止探索の実装、評価項目の追加ですね。 予定外のPCトラ…
…でも、Vista IMEも賢くなってるし、どうしようか… とりあえずVistaの方を一ヶ月位使ってみて、それで問題なければ乗り換えでもいいかな。
ひとつ上のエントリはVistaのIMEで変換したのですけど、意外とストレス無く書けた様な気が… ちょっと使い続けてみて、上手く行きそうならATOKから乗り換えるのもアリですね。
したのは良いんですが、次にやってたATOK2008のキーバインド設定が上手く行かない… C-iとC-oで文節の収縮・伸張がしたいのに、なぜかデフォルトの機能がずっと動く… なんか勘違いしてるっぽいので、とりあえず頭冷やしてからもう一度やります。 というか、上…
以前からPCの調子が悪かったのが今週水曜から悪化して、金曜〜今日まではその修理(部品交換)とかしてました。おかげでブログの巡回すら出来てねーです。 んで、ハードウェアの一部交換&OS再インストールになったんで、結構手間かかりました。今はようやく…
例のCSA例会での話題に影響されて、探索もテンプレート使って書いてます。 MINプレイヤーとMAXプレイヤーのコードを一つのテンプレート関数にまとめて書いて、最適化されたらそれぞれの手番用では不要なコードが消えてくれるのを期待してます。あ、テンプレ…
http://www.atmarkit.co.jp/fwin2k/win2ktips/1022foldertype/foldertype.html HKEY_CURRENT_USER\Software\Classes\Local Settings\Software\Microsoft\Windows\Shell\Bags\AllFolders\Shellに文字列型で名称"FolderType",値"NotSpecified"を書き込む。(Al…
学習用マシンで学習させたパラメータを定期的にfloodgate参戦用マシンに書き込み、floodgateでは常に最新のパラメータを使用する様に変更。 これに伴い、学習初期のレーティングの変化を見たいので、学習はパラメータを引き継がずに最初からやり直し。 多分…
自前でfloodgateクライアントを作ったりするのに使えそうだから、正規表現(java.util.regex)の勉強中。ネットに情報があるんで助かります。 んで、とりあえずUSIのinfoコマンドからscoreとpvを取り出すのは出来ました。これが出来るなら他は大概大丈夫でし…
今日までSP1があるのを知らなかったので。一つ困っていた問題(長いヘッダファイルをインクルードする.cppファイルが、デバッグ時にソースコードを表示出来ない)が解決したのは良いのですけど、なんでSP1がMicrosoft Updateに表示されてなかったのか謎。 MS…
とりあえず、静止探索1段目・2段目の手生成の実装と、チェック用アプリの実装は完了。floodgate参戦用マシンでチェックも並行して走らせてます*1。 手生成の実装は、1段目は全幅の生成と共用のルーチンで、手を追加する直前に成り・駒取りのフラグを見て追加…
KFEnd流の2段階静止探索にする予定ですけど、とりあえず1段目だけ実装。 やり方はGPS将棋を真似て、全幅の手生成ルーチンをテンプレート関数で作って、実際に手のリストに追加する/しないをテンプレート引数を使って判断する*1やり方にしました。これだと、…
23時間で18万局なんで、5日チョイあれば100万局行きそうですね。微妙に前より速くなってますが、何故?
http://northwood.blog60.fc2.com/blog-entry-2901.html このプロセッサのソケットはLGA1366で、現行のX58マザーはBIOSアップデートで対応可能らしいです。 で、その正体ですけど、今のところ2つの可能性があるみたいです。 32nm WestmereファミリのGulftown…