分からん

開発日記

TDLeaf(λ)を方策オフに修正しているんですが、前出来たはずの事が何故か出来ないです。うーん、どっか勘違いしてるっぽい？あ〜も〜、前のバージョンのソースは学習部分が汚すぎて、肝心の知りたい事がさっぱり分かんないし。

2009-12-08

方策オフに修正中

開発日記

旧バージョンは方策オン・オフどちらも実装していて、新バージョンは方策オン学習のみだったので、新バージョンにも方策オフモードを実装して統一する事に。これで、強化学習部分・探索・評価関数のほとんどが新旧両バージョンでほぼ同じアルゴリズムに揃え…

2009-12-08

次回選手権のライブラリルール

コンピュータ将棋

http://www.computer-shogi.org/blog/libraries_for_wcsc20_wanted/ http://www.computer-shogi.org/library/ ライブラリ募集のページに、ライブラリの使用に関する細かいルールも書いてある様です。募集自体は知ってたんですが、ルールが書いてあるとは思っ…

2009-12-08

vs ssp

開発日記

途中で止まってたんで対局数は少ないですが、39-0-18で勝率68.4％。95％信頼区間は54.8〜80.1。昨日との差分は細かいバグ取り＋持ち駒優劣関係の判断の復活だけなので、後者が効いてるんでしょう、多分。んで、止まってた原因はケアレスミスだったので対処…

2009-12-07

細々とデバッグ中

開発日記

詰め将棋がバグってたのを直したりとか、全幅の方で打ち歩詰めの判定が変だったのを発見したりとか。あ、これは修正してないんで、後でちゃんとやらないと。今日やったのはそれ位。体調悪いんで、今日はここまでとします。あ、対sspの連続対局だけは走らせ…

2009-12-07

vs ssp

開発日記

まず、今回連続対戦させたのは次の二つ。詰め将棋1秒＋通常探索1.8秒詰め将棋・通常探索を並列で1.8秒んで、1.は311-5-291で勝率51.7％、95％信頼区間が47.6〜55.7。 2.は161-0-138で勝率53.8％、95％信頼区間が48.0〜59.6。詰め将棋無しだと117-0-99で…

2009-12-06

ちまちまとデバッグ中

開発日記

探索周りとかPVとかのバグがこまごまとあったので、その辺をつぶしつつ詰め将棋の並列化をリトライ中。昨夜から走らせてた連続対戦は、途中で落ちるバグがあったんでNGでした。ついでに、アサーション有効のままビルドしてたんで、二重にNG。という訳で今…

2009-12-05

Larrabee GPU続報

コンピュータ関連

http://www.geocities.jp/andosprocinfo/wadai09/20091205.htm http://news.cnet.com/8301-13924_3-10409715-64.html?tag=newsEditorsPicksArea.0 「最初のLarrabeeはGPUとしては出荷されず、ソフトウェア開発プラットフォームとして出る」って事でしょうか…

2009-12-05

詰め将棋の並列化完了

開発日記

全幅探索と詰め将棋とを2つのスレッドで独立して動かす様にしてみました。詰め将棋部分は、ルートノードに対してひたすら読むだけですが、多少は効果あるでしょう。それから、詰め将棋そのものも打ち歩詰めの判定追加*1とか細々と修正。んで、今夜は詰め将…

2009-12-05

うそだといってよバーニィ

コンピュータ関連

http://blog.livedoor.jp/amd646464/archives/51462211.html マジっすか！？

2009-12-05

旧バージョンパラメータ vs ssp

開発日記

117-0-99で勝率54.2％。95％信頼区間は47.3〜60.9。まぁ、sspと互角にはなったみたいですね。使用したパラメータは旧バージョンで学習させたもの。探索は全幅1手＋静止探索で、目標探査率は0.1。off-policyモード。今度は詰め将棋を組み込んだバージョン…

2009-12-03

詰め将棋の改良中

開発日記

昨夜寝る前にバグ発見→今日修正する→ついでに高速化も・・・って感じで、結局今日も詰め将棋ルーチンの改良をしました。で、そのおかげで昨日書いた本の第10問が14秒で解ける様に・・・なったは良いが、第2問がやたらと時間かかる様に。あれー？多分、応手…

2009-12-03

VS ssp

開発日記学習経過

67-3-317で勝率17.4％。95％信頼区間は13.8〜21.6。という訳で、修正ありの方が微妙に勝率上でした。まぁ、これで良しとしますか。

2009-12-03

Intelが48コアのCPUを開発（ただし研究用）

コンピュータ関連

http://www.4gamer.net/games/017/G001762/20091203002/ Larrabeeかその派生型かと思いきや、まったく新規のプロセッサみたいですね。まぁでも、当分は研究用にしか出回らないみたいですし、私がこれを使う事は無いでしょう。 // 以下、18:30追記 http://pc…

2009-12-02

気分転換に詰め将棋ルーチンを実装中

開発日記

詰め将棋自体はABC探索風のルーチンにしています。「ABC探索でマージンを無限大にし、指し手を王手と応手に限定したルーチン」って書けばいいんだろうか。まぁ、実際には共謀深さが単調増加する、比較的シンプルな動作になるんですが。んで、とりあえずUSI…

2009-12-02

VS ssp

開発日記学習経過

新バージョンプログラム＋旧バージョンパラメータで一晩連続対局。結果、70-2-301で勝率18.9％、95％信頼区間は15.0〜23.2…って、こんなに弱かったっけ？パラメータのせいかバグを仕込んだせいか分からないので、今度は修正前バージョンで一晩連続対局して…

2009-12-01

敵玉との距離の評価は成果出ず

開発日記

以前の実験結果から、学習時の探索を深くすれば強くなる感じなので、そっちの方向で行ってみます。という訳で、学習用マシンには全幅1手＋静止探索にしたバージョンを投入。それから、学習と並行して探索も少しいじってます。取りあえず今日は、同一手順を…

2009-12-01

Larrabeeの将来の話

コンピュータ関連

http://pc.watch.impress.co.jp/docs/column/kaigai/20091201_332428.html 将来のIntel CPUは従来のLarge IAコア＋Larrabee派生コアって構成になるかもって話。順当と言えば順当ですが、興味深い話です。ただ、一番気になったのは最後の方にさらっと書いて…

GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

2009-12-01から1ヶ月間の記事一覧

分からん

方策オフに修正中

次回選手権のライブラリルール

vs ssp

細々とデバッグ中

vs ssp

ちまちまとデバッグ中

Larrabee GPU続報

詰め将棋の並列化完了

うそだといってよバーニィ

旧バージョンパラメータ vs ssp

詰め将棋の改良中

VS ssp

Intelが48コアのCPUを開発（ただし研究用）

気分転換に詰め将棋ルーチンを実装中

VS ssp

敵玉との距離の評価は成果出ず

Larrabeeの将来の話