GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-12-01から1ヶ月間の記事一覧

分からん

TDLeaf(λ)を方策オフに修正しているんですが、前出来たはずの事が何故か出来ないです。 うーん、どっか勘違いしてるっぽい? あ〜も〜、前のバージョンのソースは学習部分が汚すぎて、肝心の知りたい事がさっぱり分かんないし。

方策オフに修正中

旧バージョンは方策オン・オフどちらも実装していて、新バージョンは方策オン学習のみだったので、新バージョンにも方策オフモードを実装して統一する事に。 これで、強化学習部分・探索・評価関数のほとんどが新旧両バージョンでほぼ同じアルゴリズムに揃え…

次回選手権のライブラリルール

http://www.computer-shogi.org/blog/libraries_for_wcsc20_wanted/ http://www.computer-shogi.org/library/ ライブラリ募集のページに、ライブラリの使用に関する細かいルールも書いてある様です。募集自体は知ってたんですが、ルールが書いてあるとは思っ…

vs ssp

途中で止まってたんで対局数は少ないですが、39-0-18で勝率68.4%。95%信頼区間は54.8〜80.1。 昨日との差分は細かいバグ取り+持ち駒優劣関係の判断の復活だけなので、後者が効いてるんでしょう、多分。 んで、止まってた原因はケアレスミスだったので対処…

細々とデバッグ中

詰め将棋がバグってたのを直したりとか、全幅の方で打ち歩詰めの判定が変だったのを発見したりとか。あ、これは修正してないんで、後でちゃんとやらないと。 今日やったのはそれ位。体調悪いんで、今日はここまでとします。あ、対sspの連続対局だけは走らせ…

vs ssp

まず、今回連続対戦させたのは次の二つ。 詰め将棋1秒+通常探索1.8秒 詰め将棋・通常探索を並列で1.8秒 んで、1.は311-5-291で勝率51.7%、95%信頼区間が47.6〜55.7。 2.は161-0-138で勝率53.8%、95%信頼区間が48.0〜59.6。 詰め将棋無しだと117-0-99で…

ちまちまとデバッグ中

探索周りとかPVとかのバグがこまごまとあったので、その辺をつぶしつつ詰め将棋の並列化をリトライ中。 昨夜から走らせてた連続対戦は、途中で落ちるバグがあったんでNGでした。ついでに、アサーション有効のままビルドしてたんで、二重にNG。 という訳で今…

Larrabee GPU続報

http://www.geocities.jp/andosprocinfo/wadai09/20091205.htm http://news.cnet.com/8301-13924_3-10409715-64.html?tag=newsEditorsPicksArea.0 「最初のLarrabeeはGPUとしては出荷されず、ソフトウェア開発プラットフォームとして出る」って事でしょうか…

詰め将棋の並列化完了

全幅探索と詰め将棋とを2つのスレッドで独立して動かす様にしてみました。詰め将棋部分は、ルートノードに対してひたすら読むだけですが、多少は効果あるでしょう。 それから、詰め将棋そのものも打ち歩詰めの判定追加*1とか細々と修正。 んで、今夜は詰め将…

うそだといってよバーニィ

http://blog.livedoor.jp/amd646464/archives/51462211.html マジっすか!?

旧バージョンパラメータ vs ssp

117-0-99で勝率54.2%。95%信頼区間は47.3〜60.9。 まぁ、sspと互角にはなったみたいですね。 使用したパラメータは旧バージョンで学習させたもの。探索は全幅1手+静止探索で、目標探査率は0.1。off-policyモード。 今度は詰め将棋を組み込んだバージョン…

詰め将棋の改良中

昨夜寝る前にバグ発見→今日修正する→ついでに高速化も・・・って感じで、結局今日も詰め将棋ルーチンの改良をしました。 で、そのおかげで昨日書いた本の第10問が14秒で解ける様に・・・なったは良いが、第2問がやたらと時間かかる様に。あれー? 多分、応手…

VS ssp

67-3-317で勝率17.4%。95%信頼区間は13.8〜21.6。 という訳で、修正ありの方が微妙に勝率上でした。まぁ、これで良しとしますか。

Intelが48コアのCPUを開発(ただし研究用)

http://www.4gamer.net/games/017/G001762/20091203002/ Larrabeeかその派生型かと思いきや、まったく新規のプロセッサみたいですね。 まぁでも、当分は研究用にしか出回らないみたいですし、私がこれを使う事は無いでしょう。 // 以下、18:30追記 http://pc…

気分転換に詰め将棋ルーチンを実装中

詰め将棋自体はABC探索風のルーチンにしています。「ABC探索でマージンを無限大にし、指し手を王手と応手に限定したルーチン」って書けばいいんだろうか。まぁ、実際には共謀深さが単調増加する、比較的シンプルな動作になるんですが。 んで、とりあえずUSI…

VS ssp

新バージョンプログラム+旧バージョンパラメータで一晩連続対局。結果、70-2-301で勝率18.9%、95%信頼区間は15.0〜23.2…って、こんなに弱かったっけ? パラメータのせいかバグを仕込んだせいか分からないので、今度は修正前バージョンで一晩連続対局して…

敵玉との距離の評価は成果出ず

以前の実験結果から、学習時の探索を深くすれば強くなる感じなので、そっちの方向で行ってみます。 という訳で、学習用マシンには全幅1手+静止探索にしたバージョンを投入。 それから、学習と並行して探索も少しいじってます。取りあえず今日は、同一手順を…

Larrabeeの将来の話

http://pc.watch.impress.co.jp/docs/column/kaigai/20091201_332428.html 将来のIntel CPUは従来のLarge IAコア+Larrabee派生コアって構成になるかもって話。順当と言えば順当ですが、興味深い話です。 ただ、一番気になったのは最後の方にさらっと書いて…