GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-01-01から1年間の記事一覧

分からん

TDLeaf(λ)を方策オフに修正しているんですが、前出来たはずの事が何故か出来ないです。 うーん、どっか勘違いしてるっぽい? あ〜も〜、前のバージョンのソースは学習部分が汚すぎて、肝心の知りたい事がさっぱり分かんないし。

方策オフに修正中

旧バージョンは方策オン・オフどちらも実装していて、新バージョンは方策オン学習のみだったので、新バージョンにも方策オフモードを実装して統一する事に。 これで、強化学習部分・探索・評価関数のほとんどが新旧両バージョンでほぼ同じアルゴリズムに揃え…

次回選手権のライブラリルール

http://www.computer-shogi.org/blog/libraries_for_wcsc20_wanted/ http://www.computer-shogi.org/library/ ライブラリ募集のページに、ライブラリの使用に関する細かいルールも書いてある様です。募集自体は知ってたんですが、ルールが書いてあるとは思っ…

vs ssp

途中で止まってたんで対局数は少ないですが、39-0-18で勝率68.4%。95%信頼区間は54.8〜80.1。 昨日との差分は細かいバグ取り+持ち駒優劣関係の判断の復活だけなので、後者が効いてるんでしょう、多分。 んで、止まってた原因はケアレスミスだったので対処…

細々とデバッグ中

詰め将棋がバグってたのを直したりとか、全幅の方で打ち歩詰めの判定が変だったのを発見したりとか。あ、これは修正してないんで、後でちゃんとやらないと。 今日やったのはそれ位。体調悪いんで、今日はここまでとします。あ、対sspの連続対局だけは走らせ…

vs ssp

まず、今回連続対戦させたのは次の二つ。 詰め将棋1秒+通常探索1.8秒 詰め将棋・通常探索を並列で1.8秒 んで、1.は311-5-291で勝率51.7%、95%信頼区間が47.6〜55.7。 2.は161-0-138で勝率53.8%、95%信頼区間が48.0〜59.6。 詰め将棋無しだと117-0-99で…

ちまちまとデバッグ中

探索周りとかPVとかのバグがこまごまとあったので、その辺をつぶしつつ詰め将棋の並列化をリトライ中。 昨夜から走らせてた連続対戦は、途中で落ちるバグがあったんでNGでした。ついでに、アサーション有効のままビルドしてたんで、二重にNG。 という訳で今…

Larrabee GPU続報

http://www.geocities.jp/andosprocinfo/wadai09/20091205.htm http://news.cnet.com/8301-13924_3-10409715-64.html?tag=newsEditorsPicksArea.0 「最初のLarrabeeはGPUとしては出荷されず、ソフトウェア開発プラットフォームとして出る」って事でしょうか…

詰め将棋の並列化完了

全幅探索と詰め将棋とを2つのスレッドで独立して動かす様にしてみました。詰め将棋部分は、ルートノードに対してひたすら読むだけですが、多少は効果あるでしょう。 それから、詰め将棋そのものも打ち歩詰めの判定追加*1とか細々と修正。 んで、今夜は詰め将…

うそだといってよバーニィ

http://blog.livedoor.jp/amd646464/archives/51462211.html マジっすか!?

旧バージョンパラメータ vs ssp

117-0-99で勝率54.2%。95%信頼区間は47.3〜60.9。 まぁ、sspと互角にはなったみたいですね。 使用したパラメータは旧バージョンで学習させたもの。探索は全幅1手+静止探索で、目標探査率は0.1。off-policyモード。 今度は詰め将棋を組み込んだバージョン…

詰め将棋の改良中

昨夜寝る前にバグ発見→今日修正する→ついでに高速化も・・・って感じで、結局今日も詰め将棋ルーチンの改良をしました。 で、そのおかげで昨日書いた本の第10問が14秒で解ける様に・・・なったは良いが、第2問がやたらと時間かかる様に。あれー? 多分、応手…

VS ssp

67-3-317で勝率17.4%。95%信頼区間は13.8〜21.6。 という訳で、修正ありの方が微妙に勝率上でした。まぁ、これで良しとしますか。

Intelが48コアのCPUを開発(ただし研究用)

http://www.4gamer.net/games/017/G001762/20091203002/ Larrabeeかその派生型かと思いきや、まったく新規のプロセッサみたいですね。 まぁでも、当分は研究用にしか出回らないみたいですし、私がこれを使う事は無いでしょう。 // 以下、18:30追記 http://pc…

気分転換に詰め将棋ルーチンを実装中

詰め将棋自体はABC探索風のルーチンにしています。「ABC探索でマージンを無限大にし、指し手を王手と応手に限定したルーチン」って書けばいいんだろうか。まぁ、実際には共謀深さが単調増加する、比較的シンプルな動作になるんですが。 んで、とりあえずUSI…

VS ssp

新バージョンプログラム+旧バージョンパラメータで一晩連続対局。結果、70-2-301で勝率18.9%、95%信頼区間は15.0〜23.2…って、こんなに弱かったっけ? パラメータのせいかバグを仕込んだせいか分からないので、今度は修正前バージョンで一晩連続対局して…

敵玉との距離の評価は成果出ず

以前の実験結果から、学習時の探索を深くすれば強くなる感じなので、そっちの方向で行ってみます。 という訳で、学習用マシンには全幅1手+静止探索にしたバージョンを投入。 それから、学習と並行して探索も少しいじってます。取りあえず今日は、同一手順を…

Larrabeeの将来の話

http://pc.watch.impress.co.jp/docs/column/kaigai/20091201_332428.html 将来のIntel CPUは従来のLarge IAコア+Larrabee派生コアって構成になるかもって話。順当と言えば順当ですが、興味深い話です。 ただ、一番気になったのは最後の方にさらっと書いて…

敵玉との距離の評価を旧バージョンに追加

前々から考えていたんですが、どうにもちゃんと攻めてくれないのが何とかならないかと思って追加。 実装は単純で、駒と敵玉とのマンハッタン距離・駒の種類に応じて評価をするってだけです。 本当は駒の種類毎に敵玉までの手数を見るとか、成れる駒は成った…

3800万円の日本一スパコンについて

http://d.hatena.ne.jp/mkomiya/20091128/1259404590 小宮さんとこ経由で。 ここによれば、「ツリー法によるN体問題の解法」という具体的なアルゴリズム*1まで書かれているので、特定用途向けに安価に構築したスパコンなんでしょう、たぶん。 んで、気になる…

Sandy Bridge世代のデスクトップCPUロードマップ @ ExpertsPC

http://www.expertspc.com/report.php?report_no=37 ソケットはH2とB2の2種類あって、H2は以前情報の出ていた4コア+GPUのバージョン。 で、これとは別にLGA1366後継のSocket B2では、6〜8コアでGPU無しのバージョンが投入予定とか。 登場時期が2011年になっ…

旧バージョン VS ssp

127-0-278で勝率31.4%。95%信頼区間は26.9〜36.1。 新バージョン VS sspより少しだけ勝率高いですが、まぁ誤差の範囲内。 という訳で、パラメータさえ同じなら新旧両バージョンで同じ位の強さになるのがわかったので、後は学習さえちゃんと出来ればOK、と…

連続対局はなぜか途中で止まってました

もう一晩かけてやり直しですかorz それから、旧バージョンで方策オフモード・目標探査率高めにするとどういう風に学習するか気になったのでテスト中。目標探査率は、思い切って0.01→0.1に一桁上げました。 方策オフなんでランダム行動によるリスクは考えずに…

今更指し手生成祭り参加

http://vivio.blog.shinobi.jp/Entry/151/ Core 2 Extreme QX6700(2.66GHz)のマシンで、一部自殺手込みで199手生成して411,287回/秒。misaki改にもなのは改にも負けてますねorz ちなみに局面クラスのスペック。 C++ 非bitboard 利きは差分計算(飛び利き含…

ノートPC到着

AS3935-CF61 Aspire 3935出版社/メーカー: 日本エイサー発売日: 2009/04/18メディア: Personal Computers クリック: 9回この商品を含むブログ (2件) を見る この前書いたヤツです。 んで、恒例のYSSベンチ。Windows Vista x86上で8.5秒。OSをWindows 7 x64に…

VS ssp

新バージョンプログラム+旧バージョンパラメータでの一晩分の連続対局結果。 94-2-215で勝率30.4%。95%信頼区間は25.3〜35.9。「明らかにsspより弱い」って値ですね。 今夜は旧バージョンプログラム+旧バージョンパラメータで走らせてみます。

評価項目を追加&色々

まずはプログラムの修正内容。 千日手の評価値の扱いがいい加減だったのを修正。学習時と対局時で値を使い分ける様に。 筋段個別の絶対位置評価を追加。 二つ目は旧バージョンに実装していて新バージョンには無かったもので、駒の絶対位置評価を筋だけ見てや…

ノートPC注文しました

AS3935-CF61 Aspire 3935出版社/メーカー: 日本エイサー発売日: 2009/04/18メディア: Personal Computers クリック: 9回この商品を含むブログ (2件) を見る 買ったのは別の店だけど、リンクはアマゾンです。楽だし。 スペックはCore 2 Duo 2.4GHz・RAM 2GBで…

予定通りfloodgateでは負け続け

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou%2Be16be6c3e94974f8f171c0b124089ede むしろ、3勝したのが奇跡とも思えます。 んで、旧バージョンで学習したパラメータ+新バ…

floodgateに復帰しました

あんまりにも成果が出ないので、気分転換にfloodgate復帰。 …早速まったりゆうちゃんとgps500にボコられましたorz yowai_gps_pieceはいないみたいですし、当分は誰にも勝てずにR下がりまくりかも。