GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-01-01から1ヶ月間の記事一覧

Deep Learningに興味あり

http://www.sakurai.comp.ae.keio.ac.jp/classes/infosem-class/2012/15DeepLearning.pdf 画像認識・音声認識とかの分野でDeep Learningってのが出て来て、かなり高精度な学習が可能らしいです。 ちょっと興味あるんで、コンピュータ将棋に応用出来ないか検…

あ、そう言えば

↑とか↓とかで書いてる学習結果ですが、以下の条件での学習です。 方策勾配法(PGLeaf) ソフトマックス方策(温度可変) 探索は全幅1手+静止探索6手 自己対戦部分のみ並列化 学習は10万局で打ち切り …あぁ、ヒマだ。学習終わるまでやる事無いや。

やっちまったぁ!!!

No.5+駒の自由度のパラメータファイル、オペミスで消してしまった _| ̄|○ はぁ、2時間かけて再学習か。長いなぁ。

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り(1.95秒)・詰将棋ルーチン有り 53.0(140-?-1…

22nm Atom延期の噂

http://blog.livedoor.jp/amd646464/archives/52328673.html 最大4コア・2.7GHzでOut-of-Order実装と色々魅力的な噂はありますが、出荷時期が2014年1Qに遅れたらしいです。 私が今floodgate用に使ってるのが2コア・1.66GHzのAtom D510なんで、上記のスペック…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り(1.95秒)・詰将棋ルーチン有り 53.0(140-?-1…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝敗 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り(1.95秒)・詰将棋ルーチン有り 53.0(140-?-1…

おいいいいいいいいいいいいいいいいいいいいいいいいいいいいいいいいい!!!!

駒割+位置評価+王将の移動可能範囲だと、駒割+位置評価より弱くなってますよ _| ̄|○ …いやいやいや、明日の朝には挽回してる…ハズ。だと思いたい。…挽回してるといいなぁ。 なんか、気合い入れて作って「コレはいける」と思ってた評価項目がムダかもしれ…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝敗 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り(1.95秒)・詰将棋ルーチン有り 53.0(140-?-1…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝敗 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り 53.0(140-?-124) 46.8〜59.2 1 ○ - - ○ - - …

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝敗 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り 53.0(140-?-124) 46.8〜59.2 1 ○ - - ○ - - …

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝敗 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り 53.0(140-?-124) 46.8〜59.2 てか、駒割+位…

ふゆやすみのしゅくだい(じゆうけんきゅう)

正月休みも残り二日な訳ですが、以前考えてた「自己対戦の統計情報を元にした実現確率探索」を試してみようかと検討中。 んで、実現確率探索の前にGA将で実装しているHistory Heuristicに関して。 まず、純粋なHistoryではなく、確率ベースの実装になってい…

デバッグ中

とりあえず、方策勾配法の学習部分は問題が見付からず。 で、局面からの特徴量抽出部分がバグってるかと考えて、評価項目を駒割+位置評価だけにして学習中。これをベースラインにして、評価項目を追加していってどっかで弱くなるなら、そこで追加した項目に…

ヤバいヤバいヤバいヤバい

気が付くと選手権まで残り4ヶ月切ってる… まじヤバイっす _| ̄|○

3年前(WCSC20)のツツカナ・GA将戦を振り返ってみた

http://live.computer-shogi.org/wcsc20/kifu/WCSC20_U4_TTK_GAS.html あの時は途中で対局が終わっちゃって、何と言うか消化不良とか喉の小骨というか、そんな感じがずっと残ってました。 で、21回選手権は私が不参加で、22回の時はツツカナさんが遥か上に行…

VS ssp(5五将棋モード)

評価項目は駒割+位置評価のみで10万局学習後のパラメータ。 現在18勝17敗なんで、多分互角程度の実力はあるみたいです。 NPSは600〜700Knps程度なんで、評価項目全部有りより3〜4倍速い程度です。 評価項目が少ないんで王将を攻めるのはまだ下手ですが、そ…

VS sspで勝率75%

学習の設定等は、5五将棋モードで方策勾配法(全幅2手+静止探索6手)、目標探査率は0.1〜0.3でランダムウォーク。 で、勝敗は312-?-104で勝率はピッタリ75.0%。95%信頼区間は70.5〜79.1。 前より確実に強くなっているとは言えないですが、多少上向いて来…

ダメだ、全然強くならん

「もういっその事、Bonanzaベースで方策勾配法での自己対戦学習を実装してしまえ」と言う声が聞こえてきた今日この頃です。 でもなぁ…論文とか実験としてはそうするのが王道なんでしょうが、選手権に出る事考えるとそれで楽しいのかって考えると、自分的には…

USI対応の連続対戦ツールを製作中

Visual Basicの勉強も兼ねてチマチマやってます。 とりあえず、sspを一プロセス立ち上げて終局まで指せるのは確認しました。 残ってるのは下記の機能の実装(一次リリースまでの課題)。 将棋盤の表示 エンジン管理機能の拡張 局面クラスの実装 将棋のルール…

あけましておめでとうございます

GA将の現状ですが、相変わらず方策勾配法での自己対戦学習のデバッグ中です。 正月休みの間に何とかしたいんですが、このままだとヤバい感じです。正直に言うとピンチかも。 で、新年一発目のsspとの連続対局ですが、現在6勝1敗。良いペースです。 まぁ、大…