GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2015-01-01から1年間の記事一覧

将棋用評価関数、半分位実装完了

まだ駒の価値を取り出したりとかは出来ないんですが、とりあえず対局して学習出来る所までは持って行きました。 ただ、NPSが8000前後*1で、学習速度も1日1万局には届かなそうな感じです。 と言う訳で、学習時に静止探索内で枝刈りするとか、何らかの工夫は必…

CNN(Convolutional Neural Network)を使ってみた

5x5の三目並べで、Convolution Layerの有無で収束速度がどの程度違うかを実験。 で、ざっと比較すると収束までの対局数が25%前後まで減少。かなり使えそうです。 と言う訳で、正月休み中には将棋用評価関数にもこれを応用してみたいですね。

選手権の宿、確保完了

http://travel.rakuten.co.jp/HOTEL/28640/28640.html 会場近くの「ビジネスインオカベ」というホテルにしました。 前々日までのキャンセルならキャンセル料不要みたいですし、残室少なかったのでとりあえず確保。 後は、行きの新幹線を早めに予約しないと、…

選手権の申し込み完了

http://www.computer-shogi.org/wcsc26/ 先ほど第26回世界コンピュータ将棋選手権に申し込みしました。 現時点ではまだまだ弱いですが、あと4ヶ月間頑張ります。

冬休みの宿題

もうすぐ正月休みなんで、その間に基礎データを収集しようと思って、その課題。 問題設定 盤の大きさをn*nの三目並べとする(4≦n)。 どちらかのプレイヤーが自分の石を3つ直線上に連続して並べたら、そのプレイヤーの勝ち。 それ以外は通常の三目並べと同じ…

ようやく進展

Windows上でCaffeを使ってsin関数を近似する所までは成功。 自前のテスト用ドライバとの結合も上手く行ったので、次はもうちょっと複雑な関数の近似をさせてみます。 んで、明日はDeepTDLeaf(λ)を実装して三目並べの学習を開始する予定。

次回選手権までのロードマップ

まず最終的な学習ルーチンの構成は「TDLeaf(λ)+Softmax方策+DNN評価関数」とします。 時間があればPGLeafにしたいのですが、流石にそこまでは無理そうです。 んで、上記構成を実現する為にやるべき事。 DNN評価関数の実装。 Convolutionは使用せずに、全結…

大須へ行ってきました

GeForce GTX 750 Tiのボードを購入。早速学習用マシンに挿しました。 本当は980 Tiを買うつもりだったんですが、適当に作ったベンチマークでは750 Tiと性能差3割程度だったんで、安い方を選びました。 という訳で、深層強化学習と心中する準備は出来たので、…

WindowにCaffeをインストールしてみた

http://g2sim.rosx.net/2014/09/777/ こちらのサイトを参考に。 環境はWindows 7 Pro x64/Core i7 4930K/GeForce GTX 750 Ti。 インストール順ですが、Visual Studio Express 2012→CUDA toolkit 6.5としないとNGでした。最初は「どっちでも良いだろ」と考え…

4x4リバーシの学習に成功

とりあえず、忘れない様にログの先頭を貼っときます。 19:58:08 @ wmain() > Version : GA将!!!!!!!!! 9.1.0 19:58:08 @ wmain() > ビルド日時 2015/12/08 19:58:06 19:58:08 @ wmain() > exe : ..\Release\gasyou9.exe 19:58:08 @ wmain() > CWD : C:\Docum…

大体完了

OSの環境構築、ほぼ完了。 後はVisual Studioの設定をして、それで開発体制は整うかな。 あ、メーラーのインストールがまだだった…

cuDNNのサンプルコードが動く様になった

cuDNNの開発環境を構築しようとしていたらOSがお亡くなりになったので、今日は再インストールと開発環境の構築をしました。 http://d.hatena.ne.jp/torutk/20100927/p1 とりあえず、cuDNN v3にはCUDA 7.0とVisual Studio 2010が必要そうなので、後者は上記の…

Deep Learningに挑戦中

これまで使用していた線形の評価関数がどっかバグってるって言うか複雑すぎてテスト出来ねーしそもそもどうやってテストすりゃ良いかも分かんないッスわ・・・・・・と色々考えた結果、局面の生データをそのままDeep Neural Networkにぶち込んで学習させりゃ…

第9回UEC杯5五将棋大会バージョンのバイナリを公開します

Gasyou9_9.0.37.zip 5五将棋用の思考エンジンです。プチ将棋等のGUIと組み合わせてご使用下さい。 x64版のWindows(Windows 7 Professional x64で動作確認しました。) POPCNT命令をサポートしたCPU(多分、初代Core i7/5/3以降) 6.6GB以上の空きメモリ が…

GAT杯

http://minerva.cs.uec.ac.jp/~uec55shogi/wiki.cgi?page=%C2%E8%A3%B1%B2%F3GAT%C7%D5%A3%B5%B8%DE%BE%AD%B4%FD%C2%E7%B2%F1 第1回GAT杯5五将棋大会の告知ページが出来ていました。 参加したいけど、平日(水曜)の午後かぁ… 水・木と有給取っていくのも無…

評価関数のプロトタイプ作成

詳細は後日書きますが、評価関数を全面的に書き換え中。 んで、現在はランダムにパラメータを初期化して、局面評価を行う機能だけ実装完了。 今回はAVX命令を多用していますが、メモリアクセスのパターンを変えるだけで速度が一桁向上したりして、開発してい…

UEC杯5五将棋大会に行ってきました

運営の皆様ありがとうございました。開発者の皆様、色々と楽しかったです。 GA将!!!!!!!!!の戦績ですが、目標だった1/128里眼には勝ったものの、他のソフトに負けて8勝1敗で2ソフトが並ぶ形に。で、1位決定のプレーオフで負けて最終的には2位に入賞しました…

電王トーナメント行ってきました

第3回将棋電王トーナメント、今日の予選に行ってきました。 運営・ご協力の皆様ありがとうございました。開発者の皆様、お疲れ様でした。 結果は公式サイトでそのうち公開されると思いますが、GA将!!!!!!!!!は3勝5敗の19位で予選脱落となりました。 順位に関…

今更また新しい学習ルーチンの実装中

PGLeafをオンライン学習化した上で、Dropoutを実装。 4x4リバーシでザッとテストした感じ、従来より収束が速くなった感じなので、期待しています。 んで、今までは全幅3手+静止探索10手*1だったんですが、全幅部を5手に延長。 色々と理由はあるんですが、当…

電王トーナメント参加チーム

http://www.shogi.or.jp/topics/event/2015/11/30_6.html 電王トーナメントの参加チームが発表されていますが、これは決勝トーナメントは無理そうですね。 という訳で、目標は30チーム中15位以上、でしょうか。 まぁ、今更大幅な棋力向上は無理そうなので、…

GPW杯将棋大会でGA将!!!!!!!!!が優勝

http://www.computer-shogi.org/blog/gpw2015_computer-shogi_competition/ 私は現地に行けなかったので、芝浦将棋Jr.チームの和田さんに代理操作を頼んでいたのですが、4チーム参加でGA将!!!!!!!!!が3勝し優勝したとの事です。 参加チームが少なかったとは…

バグってる? そう思っていたらバグってた

えー、試しに三目並べで一晩学習させたんですが、収束しませんでした。 …さて、テスト再開しますか。

久々に学習ルーチンの実装中

合議用に複数の評価関数を並行して学習するもので、Dropout*1を使用します。概要は下記の通り。 合議クライアント8個は、全て同じ評価項目の評価関数を用いる。 8クライアントのリーグ戦の結果から学習する。 学習アルゴリズムはPGLeaf。 各クライアントは、…

割と安定してきた&今更PGOなるものを試してみた

とりあえず、一晩連続対局してもエラー発生やアサーションに引っかかる事は無くなりました。 んで、久々にPGOを実験。環境はWindows 7 Pro x64にVisual Studio 2013、Core i7 4930K。 適当に選択した8手目・40手目・74手目の局面でのNPSの変化は下記の通り。…

まだまだバグるよ〜〜

大絶賛テスト&デバッグ中です。今週末にはGPW杯があるって言うのに… んで、今日は一旦勝ちを読み切った後に、次の手番で読み切れない現象に対応(またかよ)。 詰将棋ルーチンとかグローバル詰みテーブルとかをいじったので、一晩走らせて様子を見てみます。…

弱くなってる原因、分かったかも

昨夜に、連続対局中に勝ちを読み切った後の局面で「勝ち」以外の評価値になったらエラーを吐く、というコードを仕込んで、一晩走らせてみました。 んで、結論。合議サーバのマルチスレッド絡みのバグでした。 簡単に書くと、 探索開始(合議クライアント&詰…

あれ、弱くなってる?

Bonanza 6.0(5手読み)相手に本将棋で連続対局させてみたんですが、結果は210-2-234で勝率47.3%。 前は300-5-278で勝率51.9%だったので、明らかに弱いですね。 …エンバグしてないか、5五将棋モードでssp相手に検証してみます。

今週末にやるべき事

本将棋モード時のDropoutの挙動を修正 フィッシャクロックルールの追加時間を思考時間制御に反映(GPW杯対策) とりあえず、これだけやれば大丈夫かな。

やっちまったぁ!!

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2015/10/31/wdoor+floodgate-600-10+Gasyou_Core-i7-5960X_8c16t+baby_magnum+20151031050004.csa 勝ちを読み切った瞬間に投了しちゃいました _| ̄|○ 原因はタイミング依存の単純なバグだったんで、現在は修正済み…

思考時間のマージン調整

time up連発してたんで、思考時間のマージンをやや長めに調整したバージョンに差し替えました。 20:00の回から反映されるはずです。