GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-01-01から1年間の記事一覧

致命的なバグ発見

USIモードで動作する時に、評価値差分計算の初期化を忘れてました。これが無いと、一部の評価項目を無効にしたのと同じ動作になるので、結構致命的。 という訳で修正してから学習もリトライ。明日には結果が出るでしょう。 それから、旧バージョンを引っ張り…

二駒絶対の評価はたいして成果出ず

という訳で、どっかバグってる可能性が高いので、ちまちまデバッグしてます。 とりあえず今日は評価関数の二駒相対・二駒絶対以外の部分。ソース眺めてバグを探しつつ、局面と特徴量を出力して間違い探し。 ただ、このやり方は二駒相対とかのデバッグでは使…

二駒絶対の評価を実装完了&学習用マシンに投入

結局、昨日書いたバグは気が付けばなんて事の無い部分が原因でした。 んで、ざっとテストした感じ大丈夫そうなので、思い切って学習用マシンに投入します。これで多少は囲える様になってくれないかなぁ。

学習は相変わらず上手く行きません

んで、とりあえず評価項目を揃えておこうと思い、二駒の絶対位置関係の評価を修正中。 今までは先後対称な形を考慮していなかったのですが、これを考慮する形に修正。ついでに差分計算用のコードも修正…したはずが、差分計算した評価値と一から計算し直した…

AMD Bulldozer他いろいろな情報 @ PC Watch

http://pc.watch.impress.co.jp/docs/column/kaigai/20091112_328392.html コードネームが色々出てきますが、要するにハイパフォーマンス向けのBulldozerコアと低消費電力のBobcatコアの2種類を開発中で、これらを使ったCPU・APU(GPU等を搭載したCPU)を各…

VS Lesserkai

38-1-2で勝率95%、95%信頼区間は83.1〜99.4。 まぁ、多少は強くなってる…のか?微妙。 指し手を見ていると、囲おうとしているつもりはあるらしいのですが、まだまだ稚拙ですし、攻めるのも全然出来てないです。 んで、ちゃんと学習出来ない理由の候補リス…

Progressive Wideningを実装

GPWの過去の論文を見ながら適当に実装しましたが、これで本当にあってるか不安。 まぁ、大体期待したとおりの動作になってますし、これでいい事にしましょう。 という訳で学習用マシンに投入。一晩動かして様子を見ます。

HYBRID W-ZERO3

http://plusd.itmedia.co.jp/mobile/articles/0911/11/news053.html 私が今使ってるWillcom 03と比較すると、PHSと3.5Gの2回線を内蔵したかわりに、QWERTYキーボードが無くなってますね。うーん… 料金プラン次第では乗り換えますが、いまいち食指が動かない…

VS Lesserkai

32戦して29-0-3。勝率90.6で95%信頼区間が75.0〜98.0。 全然強くなってないですね orz まぁ、まだ一晩しかたってないですし、もうちょっと様子を見ますが…望み薄かも。

UCT方策の実装完了

今日はマルチスレッド対応とか情報表示周りとかを作って、とりあえず使える形にはなりました。(ひょっとしたらまだ微調整が必要かもしれませんが。) という訳で学習用マシンに投入。2〜3日走らせてみて、強くなってる様ならfloodgateに再参戦します。 …ん…

UCTを使う方策を実装完了

平手初期局面からUCT木のリーフまではUCTで手選択し、その後はソフトマックス方策で手選択というルーチンにしました。 んで、とりあえず数局走らせてエラーが出なくなったんで、このまま一晩動かして様子を見ます。何のエラーも無く動いててくれると嬉しいの…

UCTの実装完了

とりあえず基本的な部分は完成して、現在テスト中。一晩走らせて問題が無ければ、方策に組み込んで実戦投入します。 となると、学習完了するのが来週半ば位で、その後floodgateに投入って予定で行きますか。

CPUに近付くGPU?

http://pc.watch.impress.co.jp/docs/column/kaigai/20091105_326442.html NVIDIA Fermiの解説記事なんですが、オンチップメモリ(キャッシュとかスクラッチパッドメモリ)を使って外付けのDRAMへのアクセス頻度を減らすって発想はCPU的だな〜、と思います。…

UCB1の実装は完了

後はUCTに拡張した上で方策として使える様にインタフェースを整えて、そうすれば完了。もうちょっとです。 それと、気がつくと次回選手権まで半年切ってますね。間に合うのか、これ… かなり不安になってきました。

問題レポート(Microsoftへのエラー報告)の無効化方法 for Windows 7

コントロールパネル→アクションセンター→アクションセンターの設定を変更→問題レポートの設定→レポートから除外するプログラムの設定。 ここで自作のアプリを登録しておけば、問題発生時にデバッグするかの確認ダイアログが出てくる。

序盤はUCTで指す様にするのを実装中

要するに「平手初期局面をルートノードとしてUCTの木を成長させていき、木の中ではUCTに従って手を選択。木から外れたらαβで探索して手を選択。」ってアルゴリズムです。 序盤だけはある程度大きな木の中で処理するので、序盤の指し手が多少はマシになってく…

VS Lesserkai

347-2-53で勝率86.8、95%信頼区間は83.0〜89.9。 強くなってはいるものの、まだ指し方に変なところがあるので、何とか対策したいところです。

Windows 7買いました

Home Premiumのファミリーパックという、3ライセンス入ってるやつです。今度買う予定のノートPCとかにも入れたいんで。 とりあえずインストールして普段使うアプリをインストール完了。Vistaで動いてたやつは大抵動きました。 xkeymacsのキーボードレイアウ…

二駒の相対位置関係の評価を新バージョンに移植

旧バージョンのコードほぼそのままなんで、特に問題も無くすんなり行きました。クラス名を変えたり関数名を変えたり、そういうアルゴリズム以外の変更がほとんどでした。 差分計算をしていない関係で速度は遅いですが、とりあえずそのまま学習用マシンに投入…

新バージョン VS Lesserkai

22戦して20-0-2。95%信頼区間は70.8〜98.9なので、Lesserkaiより強くなったのは確実だと思います。という訳で、今夜はsspとの連続対局を走らせておく事にします。 現状のNPSは70k位。全幅だと駒を打つ手の生成や局面遷移が遅いみたいです。学習が軌道に乗っ…

評価項目を一つ追加

守り関連の評価が出来るのが無かったので、王将周辺の利きの評価を追加したものを学習用マシンに投入。パラメータは持ち越しでやります。 明日にはまともな強さになっててくれると嬉しいなぁ。望み薄いけど。

駒割の評価にパラメータの重ね合わせを実装

成駒の価値の学習が遅いので、重ね合わせを実装してみました。 で、一度サクッと学習させたいので探索を静止探索のみ、評価項目を二駒絶対以外にして学習用マシンに投入。2晩ほど走らせれば学習完了するはずです。

駒の自由度は当面差分計算無しの方向で

プロファイルをとってみると、自由度関連の処理全部まとめてで18%程度の時間しか占めていなかったので、とりあえず優先順位は下げます。後で時間が出来たらやるって事で。 となると次はどうしようか。序盤はUCTで指すってのがひょっとしたら有効かもしれない…

駒の自由度の評価を実装

今の開発の方向性とか必要なアルゴリズムとかその辺で悩んでたんですが、とりあえず旧バージョンと同じ強さになるまでは開発をこのまま進める事にしました。 んで、評価関数に駒の自由度の評価を追加。大して難しいコード書いてないんで、割とサクッと行きま…

コンピュータ将棋関連の暫定掲示板を閉鎖しました

色々とご意見を頂きありがとうございました。 また機会があればよろしくお願いします。

静止探索0段目用の手生成ルーチン

全幅と静止探索1段目(取る手+成る手)の間にもう一段はさめないかと考えて、それ用の手生成ルーチンを検討中。 んで、「盤上の駒を動かす手」ってのはどうかと考えたものの、ちょっと数が多すぎるかも。中盤〜終盤で50手前後かな? 一局通じての平均が、全…

価格.comでノートPCを物色中

Windows7発売後に旧OSモデルが値下がりするのを期待して、その辺を中心に。 用途は選手権等の遠出に持って行ったり、ひょっとしたら(成果が出なくてやる気無かったら)対局用にも使うかもって感じで。 予算を6万円弱に設定すると必然的にCeleron/Atomしか選…

学習用マシンにつけるHDD購入

静かなのにしたかったので、2.5インチで5400rpmのやつを購入。 現在フォーマット中ですが、結構時間がかかってます…

大須のWindows 7深夜販売情報

http://goodwilledm.blog99.fc2.com/blog-entry-748.html http://www.twotop.co.jp/contents/?contid=win7_event_nagoya グッドウィルとTWO TOPもやるそうです。 私は買ってもインストールする暇が無いんで、深夜販売はスルーの方向で。ちょっと寂しい。

学習時の情報表示周りを実装

シングルスレッド学習のコードをコピペしてちょこまかと修正したら完了。意外と楽でした。 とりあえずこれで一晩動かしてみて、問題無い様なら次に行きます。 History Heuristicでオーダリング。 静止探索。 もうちょっとまともな評価項目。 ベンチマーク用…