GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

学習経過

VS Lesserkai

613-0-15で勝率97.6%。95%信頼区間は96.1〜98.7。 とりあえずれさぴょんよりは強いらしいので、今夜はsspと対局させてみます。

USI対応がほぼ完了

残り時間の情報取得とかは未着手なので、思考時間は1手1秒固定ですが。 んで、記念すべき初対局。Lesserkaiに勝っちゃいました。 現在アサーション有効で連続対局してますが、今の所4連勝。まぁまぁ良い感じです。 V2.1 N+Gasyou7 N-Lesserkai 1.3.3 P1-KY-K…

評価項目追加

上で書いた、王将周辺の利きの数の評価を追加。とりあえず動いています。 んで、終局図を見てると玉頭を守ろうとしている形跡があったりと、割と良い感じです。 そうなると実際に他のエンジンと対局する所を見てみたいので、明日のタスクはUSIの実装ですかね…

これは囲っているつもりなんだろうか

90600局終了 +---+---+---+---+---+---+---+---+---+ | |v桂| | | | | | | | +---+---+---+---+---+---+---+---+---+ |v香|v飛|v王|^圭| | | | |v香| +---+---+---+---+---+---+---+---+---+ |v歩| | |v歩|v歩| | | |v歩| +---+---+---+---+---+---+---+---+…

一応囲っているつもり

居玉のまま5八金4八銀とした形を「囲っている」と考えているらしいです。 学習条件は方策勾配法(PGLeaf)で静止探索6手のみ。対局数は約72万です。 以下、こういう「囲い」を覚えた理由の予測。 まず、基本は居飛車で開戦する事が多いです。なので、王将…

VS Lesserkai(本将棋モード)

結局18-0-2になりました。 Lesserkaiに20連勝出来る位にならないとsspと対局させても手も足も出ないんで、ssp相手に連続対局させるのは時期尚早ですね。

VS Lesserkai(本将棋モード)

圧倒的な終盤力。そして、圧倒的(にダメ)な序盤。 現在Lesserkaとの連続対局中(本将棋)なんですが、相変わらず序盤が変です。 ただ、それでも5連勝(しかも5戦全部逆転勝ち)なんで、何なんでしょうね、この棋風は。 この調子だと、sspと互角になるには…

VS spp(5五将棋モード)

本将棋用に評価項目に王将の移動可能範囲・駒の自由度を実装したバージョン。他は、駒の位置関係関連を全部実装。 んで、学習ルーチンとしてこの前からやってる2段階学習を使用したものです。 結果は351-0-1177で勝率66.5%、95%信頼区間は62.3〜70.5。 少…

思考時間を変えてみた

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 二駒絶対位置関係 三駒の相対位置関係 探索ルーチン 勝率 95%信頼区間 対局数 学習時の探索深さ 備考 B1 ○ ○ ○ ○ ○ - - 200Kノードで打ち切り・詰将棋ルーチン無し 62…

評価項目を追加

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 二駒絶対位置関係 三駒の相対位置関係 探索ルーチン 勝率 95%信頼区間 対局数 学習時の探索深さ 備考 B1 ○ ○ ○ ○ ○ - - 200Kノードで打ち切り・詰将棋ルーチン無し 62…

自己対戦学習にUCTを追加したバージョン

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 二駒絶対位置関係 三駒の相対位置関係 探索ルーチン 勝率 95%信頼区間 対局数 学習時の探索深さ 備考 B1 ○ ○ ○ ○ ○ - - 200Kノードで打ち切り・詰将棋ルーチン無し 62…

二駒絶対位置関係の評価を追加したバージョン

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 二駒絶対位置関係 三駒の相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 備考 A1 ○ ○ ○ ○ ○ - ○ - - - 200Kノードで打…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 三駒の相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 A1 ○ ○ ○ ○ ○ ○ - - - 200Kノードで打ち切り・詰将棋ルーチン無…

あんまり強くないですね

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 三駒の相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 A1 ○ ○ ○ ○ ○ ○ - - - 200Kノードで打ち切り・詰将棋ルーチン無…

ssp(5五将棋モード)相手に7連勝!!

これは期待大! 明日の朝が楽しみです。 んで、学習用マシンでは駒割を適当な値で初期化したバージョンを学習中。明日の朝には連続対戦をそっちのパラメータに差し替えて、本命の本将棋の学習を開始する予定。 出来れば今月中にfloodgateに復帰したいけど、…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 三駒の相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 A1 ○ ○ ○ ○ ○ ○ - - - 200Kノードで打ち切り・詰将棋ルーチン無…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 三駒の相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 5 ○ ○ ○ ○ ○ - - - - 200Kノードで打ち切り・詰将棋ルーチン無…

データとり直し _| ̄|○

えー、連続対戦用のプログラムに不具合があって、データとり直しになりました。 元々、初手はランダムでその後は評価値に乱数を加算するという方法で、対局結果がある程度ランダムになるようにしていました。 が、評価値に足す乱数のシードを固定にしていた…

VS ssp(5五将棋モード)

この前のNo.8のパラメータ・評価関数で、思考時間1.95秒に設定して対局。 で、詰将棋ルーチンがあると229-?-114で勝率66.8%、無しだと393-?-174で勝率69.3%。多分詰将棋ルーチンを有効にすると弱くなってます。 …となると、詰将棋のバグで詰まない玉を詰ま…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 三駒の相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 0 ○ - - ○ - - - - - 思考時間打ち切り(1.95秒)・詰将棋ルー…

VS ssp(5五将棋モード)

前に実装して結局使ってなかった三駒の相対位置関係の評価を追加。 No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 三駒の相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り(1.95秒)・詰将棋ルーチン有り 53.0(140-?-1…

あ、そう言えば

↑とか↓とかで書いてる学習結果ですが、以下の条件での学習です。 方策勾配法(PGLeaf) ソフトマックス方策(温度可変) 探索は全幅1手+静止探索6手 自己対戦部分のみ並列化 学習は10万局で打ち切り …あぁ、ヒマだ。学習終わるまでやる事無いや。

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り(1.95秒)・詰将棋ルーチン有り 53.0(140-?-1…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝率 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り(1.95秒)・詰将棋ルーチン有り 53.0(140-?-1…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝敗 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り(1.95秒)・詰将棋ルーチン有り 53.0(140-?-1…

おいいいいいいいいいいいいいいいいいいいいいいいいいいいいいいいいい!!!!

駒割+位置評価+王将の移動可能範囲だと、駒割+位置評価より弱くなってますよ _| ̄|○ …いやいやいや、明日の朝には挽回してる…ハズ。だと思いたい。…挽回してるといいなぁ。 なんか、気合い入れて作って「コレはいける」と思ってた評価項目がムダかもしれ…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝敗 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り(1.95秒)・詰将棋ルーチン有り 53.0(140-?-1…

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝敗 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り 53.0(140-?-124) 46.8〜59.2 1 ○ - - ○ - - …

VS ssp(5五将棋モード)

No. 駒割 持ち駒の組み合わせ 筋・段個別の駒の絶対位置 駒の絶対位置 二駒相対位置関係 飛び利きを遮る駒 駒の自由度 王将の移動可能範囲 探索ルーチン 勝敗 95%信頼区間 0 ○ - - ○ - - - - 思考時間打ち切り 53.0(140-?-124) 46.8〜59.2 1 ○ - - ○ - - …