GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2012-10-01から1ヶ月間の記事一覧

昨夜の続き

http://d.hatena.ne.jp/Gasyou/20121030/1351612797 酔いが覚めてみると一つ見落としていたのに気付きました。合議クライアントの多様性が失われる危険性があります。 まず、合議で強くする為に必要なのは、「各クライアントの正解率を高める」事では無く「…

気が付けばGPWまで後9日

楽しみなのは良いんですが、ポスター発表の準備がガガガ・・・・・ 原案は出来てるんで細々修正して、後は当日用の準備して。 あ、それからちゃんとした服買わないと。今着てるのはかなりボロいんで、それはさすがに・・・ですし。 ンでもってGPW杯は本将棋…

合議における内部局面の最善手共有によるReduction抑制

酔った勢いで書いてるんで色々読み抜けとか考慮漏れとかありそうですが、思い付いたんでとりあえず書いてみます。 まず、現在のGA将の思考ルーチンは全幅探索*1+LMRの部分と、全幅末端での2段階静止探索になっています。 で、LMRで重要な手を短縮してしまう…

稲庭将棋さんが参戦してる

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2012/10/28/wdoor+floodgate-900-0+inaniwa+Gasyou_Atom-D510_1c2t+20121028190005.csa さっきGasyouとも当たりましたが、ひどい負け方をしました。 500手位まで稲庭囲いを崩せなくて、何とか崩せたと思ったら残り…

自分のバックアップ手法について語ってみる

上に関連して、自分がどうバックアップしているかをちょいと語ってみます。参考になれば幸いです。 まず、「可能な限り自動化する」「本当に重要なデータは二重にバックアップする」を基本方針としています。 で、バックアップ先は下記の二箇所です。 デスク…

HDD逝ったあああああああああああああああああ!!!!!!!!!!!!!!

まぁ、バックアップ用HDDなんで、重要なデータの損失は無いんですが。 んで、HDD死亡の現場に立ち会ったのは初めてなんで、記念にこれまでの経過を書いてみます。死亡したのはUSB接続の外付HDDです。 9月半ば頃 日次のバックアップ中にバックアップソフトが…

Visual C++ 2008でのOpenMPとPGO

両立出来ないんだ… 今日コンパイルエラーが出て初めて知った。 まぁ、PGOの性能アップはせいぜい10数%だったからいい…訳無いよなぁ。CPUを2ランク位上のと交換したほどの性能差あるし。 これは、並列化のコードを自前でゴリゴリ書くしか無い?

FX-8350発表&発売

http://pc.watch.impress.co.jp/docs/news/20121023_567751.html http://pc.watch.impress.co.jp/docs/topic/feature/20121023_567804.html 性能的にはライバルのCore i5-3570Kとは勝ったり負けたりで、マルチスレッド性能なら3570Kを超えてる感じはしますね…

FX-8350は¥18,000前後?

http://www.gdm.or.jp/voices/2012/1020/8448 「某ショップ店員談」となっているのでそこそこ正確な情報だとは思いますが、これなら妥当な金額設定ではないかと。 私はi7 3770K買った直後なんで手を出しませんが、マルチスレッドの学習ルーチンを走らせるな…

バグに気がついた

入玉宣言絡みで、いつかは起こりそうなバグがあったんで、大会までには対策しないと。 バグは二つあって ルートノードでどの手を指しても相手の入玉勝ちになる場合、ムーブオーダリングで最初に来た手を指す。 ある程度深い所で相手の入玉勝ちと自玉が詰んで…

サーバ向けAtomは8コアへ

http://blog.livedoor.jp/amd646464/archives/52310726.html Avotonというコードネームがついていますが、クロックは最高2.7GHz・TDP 5〜20Wというスペックが出ています。 8コア・2.4GHz・TDP 20Wならかなり魅力的なんですが、多分一般向けには売らないでし…

Opteron 6300シリーズはあまりクロックが伸びないらしい

http://northwood.blog60.fc2.com/blog-entry-6292.html Piledriver系コアの新Opteronですが、最上位の6386SEが2.8GHzで16コアらしいです。IPCの向上も数%らしいですし、Xeonのハイエンドモデルに追い付くのは厳しそうな感じですね。 後はコストパフォーマ…

色々あった結果

悪魔に魂を売る事にしました。ではなくて、教師有り学習に手を出します。 別に強化学習を諦めた訳では無くて、教師有りで初期学習→強化学習でさらに棋力アップってプランです。 棋譜は入手済みで読み込み部分も完成してるんで、後は学習部分をガリガリ書くだ…

GPW2012で発表します

http://sig-gi.tanaka.ecc.u-tokyo.ac.jp/gpw/2012/schedule.html 何とか機会を貰えたので、GPWで今やっているコンピュータ将棋の学習法についてポスターセッションで発表する予定です。 ・P-2 方策勾配法による静的局面評価関数の強化学習についての一考察 …

サブゴール自動生成を実装完了

http://d.hatena.ne.jp/Gasyou/20121002/1349182187 で書いたやつです。 i手目の手のサブ報酬は、「勝敗に応じた報酬 * 0.99^i手目から終局までの手数」を目標値として設定する様にしました。言ってみればモンテカルロ法みたいにサブゴールの報酬を決定(学…

Deep Blueには致命的なバグがあった…らしい

http://wired.jp/2012/10/03/deep-blue-computer-bug/ どうも、探索中にエラーが発生するとランダムに指し手を選択する様になっていたらしいですね。 で、本番でエラーが出てランダムに手を選んだんだけど、それがたまたま「あれは信じられないくらい洗練さ…

面白そうな論文見つけた

http://aiwww.main.ist.hokudai.ac.jp/contents/research/activities/thesis/M_23_kimura.pdf 強化学習において、いきなりゴール(将棋の場合だと勝敗)に辿り着くのは難しいので、途中にサブゴールを設定し、そこに到達すると報酬を与えるという事は結構さ…