2009-11-01から1ヶ月間の記事一覧
前々から考えていたんですが、どうにもちゃんと攻めてくれないのが何とかならないかと思って追加。 実装は単純で、駒と敵玉とのマンハッタン距離・駒の種類に応じて評価をするってだけです。 本当は駒の種類毎に敵玉までの手数を見るとか、成れる駒は成った…
http://d.hatena.ne.jp/mkomiya/20091128/1259404590 小宮さんとこ経由で。 ここによれば、「ツリー法によるN体問題の解法」という具体的なアルゴリズム*1まで書かれているので、特定用途向けに安価に構築したスパコンなんでしょう、たぶん。 んで、気になる…
http://www.expertspc.com/report.php?report_no=37 ソケットはH2とB2の2種類あって、H2は以前情報の出ていた4コア+GPUのバージョン。 で、これとは別にLGA1366後継のSocket B2では、6〜8コアでGPU無しのバージョンが投入予定とか。 登場時期が2011年になっ…
127-0-278で勝率31.4%。95%信頼区間は26.9〜36.1。 新バージョン VS sspより少しだけ勝率高いですが、まぁ誤差の範囲内。 という訳で、パラメータさえ同じなら新旧両バージョンで同じ位の強さになるのがわかったので、後は学習さえちゃんと出来ればOK、と…
もう一晩かけてやり直しですかorz それから、旧バージョンで方策オフモード・目標探査率高めにするとどういう風に学習するか気になったのでテスト中。目標探査率は、思い切って0.01→0.1に一桁上げました。 方策オフなんでランダム行動によるリスクは考えずに…
http://vivio.blog.shinobi.jp/Entry/151/ Core 2 Extreme QX6700(2.66GHz)のマシンで、一部自殺手込みで199手生成して411,287回/秒。misaki改にもなのは改にも負けてますねorz ちなみに局面クラスのスペック。 C++ 非bitboard 利きは差分計算(飛び利き含…
AS3935-CF61 Aspire 3935出版社/メーカー: 日本エイサー発売日: 2009/04/18メディア: Personal Computers クリック: 9回この商品を含むブログ (2件) を見る この前書いたヤツです。 んで、恒例のYSSベンチ。Windows Vista x86上で8.5秒。OSをWindows 7 x64に…
新バージョンプログラム+旧バージョンパラメータでの一晩分の連続対局結果。 94-2-215で勝率30.4%。95%信頼区間は25.3〜35.9。「明らかにsspより弱い」って値ですね。 今夜は旧バージョンプログラム+旧バージョンパラメータで走らせてみます。
まずはプログラムの修正内容。 千日手の評価値の扱いがいい加減だったのを修正。学習時と対局時で値を使い分ける様に。 筋段個別の絶対位置評価を追加。 二つ目は旧バージョンに実装していて新バージョンには無かったもので、駒の絶対位置評価を筋だけ見てや…
AS3935-CF61 Aspire 3935出版社/メーカー: 日本エイサー発売日: 2009/04/18メディア: Personal Computers クリック: 9回この商品を含むブログ (2件) を見る 買ったのは別の店だけど、リンクはアマゾンです。楽だし。 スペックはCore 2 Duo 2.4GHz・RAM 2GBで…
http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou%2Be16be6c3e94974f8f171c0b124089ede むしろ、3勝したのが奇跡とも思えます。 んで、旧バージョンで学習したパラメータ+新バ…
あんまりにも成果が出ないので、気分転換にfloodgate復帰。 …早速まったりゆうちゃんとgps500にボコられましたorz yowai_gps_pieceはいないみたいですし、当分は誰にも勝てずにR下がりまくりかも。
USIモードで動作する時に、評価値差分計算の初期化を忘れてました。これが無いと、一部の評価項目を無効にしたのと同じ動作になるので、結構致命的。 という訳で修正してから学習もリトライ。明日には結果が出るでしょう。 それから、旧バージョンを引っ張り…
という訳で、どっかバグってる可能性が高いので、ちまちまデバッグしてます。 とりあえず今日は評価関数の二駒相対・二駒絶対以外の部分。ソース眺めてバグを探しつつ、局面と特徴量を出力して間違い探し。 ただ、このやり方は二駒相対とかのデバッグでは使…
結局、昨日書いたバグは気が付けばなんて事の無い部分が原因でした。 んで、ざっとテストした感じ大丈夫そうなので、思い切って学習用マシンに投入します。これで多少は囲える様になってくれないかなぁ。
んで、とりあえず評価項目を揃えておこうと思い、二駒の絶対位置関係の評価を修正中。 今までは先後対称な形を考慮していなかったのですが、これを考慮する形に修正。ついでに差分計算用のコードも修正…したはずが、差分計算した評価値と一から計算し直した…
http://pc.watch.impress.co.jp/docs/column/kaigai/20091112_328392.html コードネームが色々出てきますが、要するにハイパフォーマンス向けのBulldozerコアと低消費電力のBobcatコアの2種類を開発中で、これらを使ったCPU・APU(GPU等を搭載したCPU)を各…
38-1-2で勝率95%、95%信頼区間は83.1〜99.4。 まぁ、多少は強くなってる…のか?微妙。 指し手を見ていると、囲おうとしているつもりはあるらしいのですが、まだまだ稚拙ですし、攻めるのも全然出来てないです。 んで、ちゃんと学習出来ない理由の候補リス…
GPWの過去の論文を見ながら適当に実装しましたが、これで本当にあってるか不安。 まぁ、大体期待したとおりの動作になってますし、これでいい事にしましょう。 という訳で学習用マシンに投入。一晩動かして様子を見ます。
http://plusd.itmedia.co.jp/mobile/articles/0911/11/news053.html 私が今使ってるWillcom 03と比較すると、PHSと3.5Gの2回線を内蔵したかわりに、QWERTYキーボードが無くなってますね。うーん… 料金プラン次第では乗り換えますが、いまいち食指が動かない…
32戦して29-0-3。勝率90.6で95%信頼区間が75.0〜98.0。 全然強くなってないですね orz まぁ、まだ一晩しかたってないですし、もうちょっと様子を見ますが…望み薄かも。
今日はマルチスレッド対応とか情報表示周りとかを作って、とりあえず使える形にはなりました。(ひょっとしたらまだ微調整が必要かもしれませんが。) という訳で学習用マシンに投入。2〜3日走らせてみて、強くなってる様ならfloodgateに再参戦します。 …ん…
平手初期局面からUCT木のリーフまではUCTで手選択し、その後はソフトマックス方策で手選択というルーチンにしました。 んで、とりあえず数局走らせてエラーが出なくなったんで、このまま一晩動かして様子を見ます。何のエラーも無く動いててくれると嬉しいの…
とりあえず基本的な部分は完成して、現在テスト中。一晩走らせて問題が無ければ、方策に組み込んで実戦投入します。 となると、学習完了するのが来週半ば位で、その後floodgateに投入って予定で行きますか。
http://pc.watch.impress.co.jp/docs/column/kaigai/20091105_326442.html NVIDIA Fermiの解説記事なんですが、オンチップメモリ(キャッシュとかスクラッチパッドメモリ)を使って外付けのDRAMへのアクセス頻度を減らすって発想はCPU的だな〜、と思います。…
後はUCTに拡張した上で方策として使える様にインタフェースを整えて、そうすれば完了。もうちょっとです。 それと、気がつくと次回選手権まで半年切ってますね。間に合うのか、これ… かなり不安になってきました。
コントロールパネル→アクションセンター→アクションセンターの設定を変更→問題レポートの設定→レポートから除外するプログラムの設定。 ここで自作のアプリを登録しておけば、問題発生時にデバッグするかの確認ダイアログが出てくる。
要するに「平手初期局面をルートノードとしてUCTの木を成長させていき、木の中ではUCTに従って手を選択。木から外れたらαβで探索して手を選択。」ってアルゴリズムです。 序盤だけはある程度大きな木の中で処理するので、序盤の指し手が多少はマシになってく…
347-2-53で勝率86.8、95%信頼区間は83.0〜89.9。 強くなってはいるものの、まだ指し方に変なところがあるので、何とか対策したいところです。