GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2010-04-01から1ヶ月間の記事一覧

18:30の回からLMRで強めに短縮したバージョンを投入します

ちなみに今のLMRのコードはこんな感じ。 // この関数の返り値の分だけ浅く探索する double ParallelAlphaBetaSearcher::calcLmrOffset( const size_t depth, // 探索深さ const size_t rank, // 手の順位 const Move move ) { // 手の情報 // 深さ3以下なら…

VS ssp 一晩分

GA将!!!!の設定は並列化あり、LMR控えめでマシンはCore 2 Extreme QX6700。 結果は237-2-91で勝率72.3%、95%信頼区間は67.1〜77.0。 これだけ見ると強くなってるんですが、floodgateではR下がりまくり。以前にCore 2 Duoで参戦した時より下がってます。 ど…

密結合合議って出来ないもんだろうか

合議は基本的には疎結合なものですが、一部の情報は共有出来ると思うんですよ。 例えば“詰み”の情報は複数のエンジンで共有しても問題ないはず。これは、評価関数や乱数の違いに依存せず、単純に局面だけに依存する情報なので。 なので、あるエンジンが詰み…

Futility Pruningの勉強をしているわけですが

floodgateの対局が気になって進まない罠。 どうしよっかなぁ、参戦は自分が寝てる時だけに限るか? でも、早くRがついて欲しいし、どの程度強いのか気になるし。うーん…

Tohske躍進

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=tohske2010%2B5eb1ff9ba54e6b0f0e9dd5e633783c64 現在2週間レーティングが1687! こっちはCore i7 940投入で挽回出来るか!? 出来な…

SpursEngine*4な拡張カード

http://akiba-pc.watch.impress.co.jp/hotline/20100417/etc_leadtek.html 面白そうではあるのですが、所詮1.5GHzで16コアですし、あんまり魅力はないかも。汎用性求めるならCore i7 980X買った方が幸せになりそうな予感。 ただ、オンチップの超高速メインメ…

とりあえず目先の事に集中しよう

TreeStrapは一旦封印。選手権後にやります。 んで、選手権までにやる事。 LMRのパラメータ調整 futility pruning実装&パラメータ調整 並列化の効率上げる 選手権用マシンでfloodgate参戦 Ponderはもう時間が無いんで諦めました。下手なコトしてエンバグする…

HYBRID W-ZERO3購入しました

昨日…(汗 すんません、ブログ書くのも忘れて、カスタマイズに没頭していました。 どうやって買ったかネタばらしすると、じゃんぱらで中古の本体だけ購入。W-SIMもFOMAのSIMも無いんで、Willcom 03で使っていたW-SIMを挿して使ってます。 3Gの方はb-mobileSI…

Phenom II X6発売日等の情報

http://www.gdm.or.jp/voices_html/201004/1301.html 4/27正式発表で4/29に発売みたいですね。 価格は1090T BEが¥35,000前後って話なので、6コアとしては結構安いです。

お弁当の予約完了

CSA MLのメールを読んで思い出して、慌てて予約しました。夜は有志でどっか食べに行くと思うので、3日間の昼の分だけです。 えーっと、後はPC送る準備さえすれば選手権の用意はだいじょうぶかな?

致命的なバグを修正

入浴中にバグに気づいて、急いであがって修正しました。 んで、バグの内容は「後手番だとパラメータを逆方向に更新してしまう」と言うもの。誤差の計算ミスが原因でした。 てか、簡単なテストすれば気付いたはずのバグですし、今まで残ってたのは大問題です…

今日は修正少しだけ

別件で用事があったんで開発の時間が取れないっす orz 評価関数のパラメータの変化をログファイルに記録 詰将棋ルーチンを外す 一つ目は学習がちゃんと進んでるかのチェック用。どうも、弱くなる方向に学習してる感じがするんで、一度確認してみようかと思っ…

HYBRID W-ZERO3完売!?

http://twitter.com/willcom_store/status/12090804691 会社から帰ったらこれだよ orz とりあえず今持ってるWillcom 03の交換用バッテリーを購入したんで、当面はそれを使ってしのぎつつ次の機種をどうするか考えます。 …HYBRID W-ZERO3生産中止が公式に発表…

TreeStrap(minimax)、とりあえず完成

まだデバッグ中ですが、ほぼ論文の通りの動作にはなったかと思います。 ただ、学習率が1E-6では高すぎる感じだった*1ので、1E-9に下げましたが。 現在は学習用マシンでリリースモード、開発用マシンではアサーション有効にして並行して走らせてます。上手く…

Sandy Bridge情報@PC Watch

http://pc.watch.impress.co.jp/docs/column/kaigai/20100412_360173.html 本題は後半のGPUの話なんですが、前半の実行ユニットやらAVXやら、そういった細かい情報も興味深いです。 明日からのIDFで詳細が発表されるかもしれないって話ですし、予習がてら読…

明日〜明後日にかけてHYBRID W-ZERO3再入荷?

http://twitter.com/willcom_store/status/12019411871 別エントリには若干数って書いてあったし、メーカ在庫分だけって事かな? いずれにせよ、見つけたら即購入せねば。

TreeStrap(minimax)半分くらい実装完了

論文のアルゴリズムそのままだと実装に時間がかかりそうだったので、探索しながら内部ノードでいきなりパラメータ更新する*1っていう手抜きコードで実装。取り敢えず動く様になりました。 あ、それから時間制御もFischer time controlsではなく、一手2秒固定…

TreeStrap(αβ)って、floodgateで学習するにはいいかも

1000局で収束するって事は、3週間で終わるって事ですよね。 おまけに、ほとんどの相手は自分より強くて、棋風も色々で、持ち時間もたっぷり。良い事ずくめ。 うーん、選手権終わったらやってみるか?

TreeStrap(minimax)でいきなりつまづく

search treeって静止探索部分も含むのか? 含まないのか? 流石に静止探索内で評価値のバックアップするのはやりすぎな気がするから、含まないものとして実装しておこう。 でも本当はどっちなんだろう・・・気になる。

今からTreeStrap(minimax)を実装してみます

なんでいきなりTreeStrap(αβ)を実装しないかと言うと minimaxの方を練習&プロトタイプとして使いたい アルゴリズムがシンプルなので、取っ掛かりとしては良さげ minimaxでもTDLeaf(λ)より性能が良い(と論文には書いてあった) てな感じです。 今日中に動作…

Bootstrapping from Game Tree Search本当の簡単なまとめ

前のが長くなりすぎたんで。 既存手法(サミュエルのチェッカープレイヤーやTDLeaf(λ))は内部ノードの評価値を捨てているから非効率的だった。 TreeStrap(minimax)だと内部ノードの評価値もパラメータ更新に使うので効率的! TreeStrap(αβ)だと上界・下界し…

Bootstrapping from Game Tree Search簡単なまとめ【大幅修正版】

自分が読んだところまで、メモがてら書いていきます。 ※1 多分私の勘違い等が含まれています。 ※2 ざっくり意訳していますので、細かいところは原文見て下さい。 英語がスラスラ読める人は、以下の文読んでも時間の無駄なんで つhttp://books.nips.cc/nips…

Bootstrapping from Game Tree Searchというものがあるらしい

id:gamidereさんが紹介されていたのですが、比較的最近の論文みたいですね(2009年?)。 内容はまだちゃんと読んでないですが、9ページだけなので急いで読んでみます。一つ嬉しかったのは、自己対戦で強くなったと書いてあるので、その結果に勇気づけられま…

第二のCUDA和書

CUDA高速GPUプログラミング入門作者: 岡田賢治,小山田耕二出版社/メーカー: 秀和システム発売日: 2010/03/25メディア: 単行本購入: 1人 クリック: 53回この商品を含むブログ (7件) を見る アマゾンのオススメリストにあって気付きました。目次から予測するに…

並列化、ムズい

以下、グチです。 結局さー、αβっていう逐次実行前提のアルゴリズムを無理やり並列化してるから効率出ないんじゃん、根本的には。 まぁ、賢い人がやればそれでも高速化出来るんだろうけど、私には荷が重いってゆーか、無理ポ。 ついでに言うと、「強化学習で…

鬼が笑う来年の話

まず、強化学習でのパラメータ調整が上手く行く事前提で。 合議とか面白そうだからやってみたいなぁ。 と言っても、単に乱数加えてやるだけの合議じゃ後追いで面白くないんで、強化学習のメリットを活かす方向で。 例えば、今の評価項目から 二駒の相対位置…

選手権までにやる事

探索の検証&ベンチマーク用のコード整備 Ponder実装 futility pruning実装&チューン デバッグ 学習関連は今からもうちょっとあがいてみますが、どうにも上手く行かなさそうな感じです。引き続き、探索でごまかして何とかする方向でやってみます。

VS ssp一晩分

210-2-104で勝率66.9%、95%信頼区間が61.4〜72.1。 ただし、Core 2の4コアマシンで動かしててGA将!!!!だけ並列化してるんで、前と同じ条件*1だともっと勝率落ちると思われます。 それから、開発日記には書いてなかったけど、LMRをこっそり実装しました。そ…

Sandy Bridge情報@PC Watch

http://pc.watch.impress.co.jp/docs/column/kaigai/20100409_360112.html メインストリームデスクトップ&ノート向けが先行し、来年前半登場。2〜4コアでGPU内蔵。 ハイエンドデスクトップ&サーバ向けは約半年遅れで登場。最大8コア。 ソケットは現在のも…

並列化バージョン弱くね? 疑惑

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou_Atom-D510_1c2t%2Bedd1a7ba7a36303c69262a79f81d0a78 http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=…