GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-08-01から1ヶ月間の記事一覧

さて、と。

それでは今から駒の自由度の評価を実装しますか。 今日はお盆のお参りだったんで開発には時間が取れませんでした。 実質あと3日でどれだけ出来るかは分かりませんが、評価項目の実装だけは一通り終えたいですね。 …詰将棋ルーチンは、まぁ、時間があればとい…

レーティング付きました

http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html 現在の2週間Rが1455で、gps500(1435)とほぼ並んでいます。 ただ、現時点では実力の近い相手との対局があまり無いので、しばらくはRが激しく変動するかとは思います。 さーて、頑張って…

打ち歩詰め

打ち歩詰めの処理を入れ忘れてて、ローカル対局でやっちゃいました。 手生成ルーチンが、ルートノードでは打ち歩詰めの手を生成しない様になっているので、打ち歩詰めをしてしまう事自体はありません。 ただ、内部ノードで打ち歩詰めを「勝ち」と認識してし…

何か調子悪いなぁ

http://wdoor.c.u-tokyo.ac.jp/shogi/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou_Atom-D510_1c1t 昨夜から接続が切れる現象が頻発しています。 どこに原因があるのかイマイチ不明なので、とりあえず放置しますが、原…

2戦目

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2013/08/14/wdoor+floodgate-900-0+HikariShogi_Node.js+Gasyou_Atom-D510_1c1t+20130814223006.csa 無事勝てました。これで1勝1敗ですから、明日朝にはレーティングが付いてるはずです。 んでもって休み中の残タス…

あう、やっちまった…

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2013/08/14/wdoor+floodgate-900-0+Gasyou_Atom-D510_1c1t+gps_normal+20130814220004.csa floodgate参戦するつもりが、凡ミスでabnormalになってしまった… チームGPSの皆さん、すいません。 んで、気を取り直して…

宣言して自分を追い込むテスト

「今日中にUSIにちゃんと対応してfloodagateに参戦します。」 言ったからにはやらないと。 ちなみに参戦までの残タスク。 USIのコマンドから残り時間を取得する。 思考時間制御。 まぁ、既存コードを流用すれば何とかなるでしょう。多分。

VS sspで勝率50%超えた

http://d.hatena.ne.jp/Gasyou/20130812/1376273087 で使ってたパラメータそのままで、探索ルーチンをFutility Pruning無しに変更したもの。 結果は78-0-77で勝率50.3%。95%信頼区間は42.2〜58.4。 どうも、Futilityのバグかパラメータ調整不足か、そんな…

なつやすみのしゅくだい

評価項目を一通り実装する 詰将棋ルーチンを実装する USIにちゃんと対応する これ位かな、現実的に出来そうなのは。

「知的ナノ構造体」???

http://www.riken.jp/pr/press/2013/20130809_1/ はてブ経由で拾ってきたニュースで、まだよく理解出来ていないんですがとりあえずリンク。 んで、まずこれは突っ込まざるをえないのでとりあえず。 そして、このアルゴリズムが多本腕バンディット問題の正解…

VS ssp(本将棋モード) 一晩分

133-8-196で勝率40.4%、95%信頼区間は35.1〜45.9。 前よりちょっとだけ勝率上がったんで、良い感じですね。 さて、それでは次は昨夜から学習させてた分を連続対戦させてみます。今度は、評価項目は同じで駒割の特徴量を8倍したものです。

VS ssp(本将棋モード) 一晩分

56-2-121で勝率31.6%、95%信頼区間は24.9〜39.0。 評価項目は駒割+盤上の利きの数の評価+王将周辺の利きの数の評価。 という訳で、これを基準として評価項目追加で強くなってるか検証していきます。

そんなに悪くない

VS ssp(本将棋モード)で、現在32-2-49。評価項目が少ない事を考えると、予想以上の勝率です。 現在、駒の絶対位置評価を付け加えたものを学習中なんで、明日朝までこのまま連続対局して、その後パラメータファイルを置き換えて対局させてみます。

VS Lesserkai

613-0-15で勝率97.6%。95%信頼区間は96.1〜98.7。 とりあえずれさぴょんよりは強いらしいので、今夜はsspと対局させてみます。

USI対応がほぼ完了

残り時間の情報取得とかは未着手なので、思考時間は1手1秒固定ですが。 んで、記念すべき初対局。Lesserkaiに勝っちゃいました。 現在アサーション有効で連続対局してますが、今の所4連勝。まぁまぁ良い感じです。 V2.1 N+Gasyou7 N-Lesserkai 1.3.3 P1-KY-K…

評価項目追加

上で書いた、王将周辺の利きの数の評価を追加。とりあえず動いています。 んで、終局図を見てると玉頭を守ろうとしている形跡があったりと、割と良い感じです。 そうなると実際に他のエンジンと対局する所を見てみたいので、明日のタスクはUSIの実装ですかね…

PGLeafがちゃんと動く様になってきた

以前は駒割すらロクに学習出来ませんでした*1が、評価項目を変更してみたら意外と良い感じになってきました。 まぁ、まだ歩の価値がやたら高い(桂馬・香車の8割程度)とか、飛車とと金がほぼ同価値とか、ツッコミどころは山ほどありますが。 んで、評価項目…

これは囲っているつもりなんだろうか

90600局終了 +---+---+---+---+---+---+---+---+---+ | |v桂| | | | | | | | +---+---+---+---+---+---+---+---+---+ |v香|v飛|v王|^圭| | | | |v香| +---+---+---+---+---+---+---+---+---+ |v歩| | |v歩|v歩| | | |v歩| +---+---+---+---+---+---+---+---+…

面白そうな学習アルゴリズムを見つけた

http://d.hatena.ne.jp/n_shuyo/20130805 「能動学習」と言い、教師あり学習の一種(ただ、純粋な教師あり学習からは少し外れる?)らしい。 んで、能動学習の詳細はリンク先を見てもらうとして、こういう考え方を強化学習に応用出来ないものかと検討中。 例…