将棋用評価関数、半分位実装完了

開発日記

まだ駒の価値を取り出したりとかは出来ないんですが、とりあえず対局して学習出来る所までは持って行きました。ただ、NPSが8000前後*1で、学習速度も1日1万局には届かなそうな感じです。と言う訳で、学習時に静止探索内で枝刈りするとか、何らかの工夫は必…

2015-12-26

CNN(Convolutional Neural Network)を使ってみた

開発日記

5x5の三目並べで、Convolution Layerの有無で収束速度がどの程度違うかを実験。で、ざっと比較すると収束までの対局数が25％前後まで減少。かなり使えそうです。と言う訳で、正月休み中には将棋用評価関数にもこれを応用してみたいですね。

2015-12-26

選手権の宿、確保完了

コンピュータ将棋

http://travel.rakuten.co.jp/HOTEL/28640/28640.html 会場近くの「ビジネスインオカベ」というホテルにしました。前々日までのキャンセルならキャンセル料不要みたいですし、残室少なかったのでとりあえず確保。後は、行きの新幹線を早めに予約しないと、…

2015-12-26

選手権の申し込み完了

コンピュータ将棋開発日記

http://www.computer-shogi.org/wcsc26/ 先ほど第26回世界コンピュータ将棋選手権に申し込みしました。現時点ではまだまだ弱いですが、あと4ヶ月間頑張ります。

2015-12-24

冬休みの宿題

開発日記

もうすぐ正月休みなんで、その間に基礎データを収集しようと思って、その課題。問題設定盤の大きさをn*nの三目並べとする（4≦n）。どちらかのプレイヤーが自分の石を3つ直線上に連続して並べたら、そのプレイヤーの勝ち。それ以外は通常の三目並べと同じ…

2015-12-20

ようやく進展

開発日記

Windows上でCaffeを使ってsin関数を近似する所までは成功。自前のテスト用ドライバとの結合も上手く行ったので、次はもうちょっと複雑な関数の近似をさせてみます。んで、明日はDeepTDLeaf(λ)を実装して三目並べの学習を開始する予定。

2015-12-20

次回選手権までのロードマップ

開発日記 TODO

まず最終的な学習ルーチンの構成は「TDLeaf(λ)＋Softmax方策＋DNN評価関数」とします。時間があればPGLeafにしたいのですが、流石にそこまでは無理そうです。んで、上記構成を実現する為にやるべき事。 DNN評価関数の実装。 Convolutionは使用せずに、全結…

2015-12-19

大須へ行ってきました

開発日記コンピュータ関連

GeForce GTX 750 Tiのボードを購入。早速学習用マシンに挿しました。本当は980 Tiを買うつもりだったんですが、適当に作ったベンチマークでは750 Tiと性能差3割程度だったんで、安い方を選びました。という訳で、深層強化学習と心中する準備は出来たので、…

2015-12-13

WindowにCaffeをインストールしてみた

開発日記

http://g2sim.rosx.net/2014/09/777/ こちらのサイトを参考に。環境はWindows 7 Pro x64/Core i7 4930K/GeForce GTX 750 Ti。インストール順ですが、Visual Studio Express 2012→CUDA toolkit 6.5としないとNGでした。最初は「どっちでも良いだろ」と考え…

2015-12-08

4x4リバーシの学習に成功

開発日記

とりあえず、忘れない様にログの先頭を貼っときます。 19:58:08 @ wmain() > Version : GA将!!!!!!!!! 9.1.0 19:58:08 @ wmain() > ビルド日時 2015/12/08 19:58:06 19:58:08 @ wmain() > exe : ..\Release\gasyou9.exe 19:58:08 @ wmain() > CWD : C:\Docum…

2015-12-05

大体完了

開発日記

OSの環境構築、ほぼ完了。後はVisual Studioの設定をして、それで開発体制は整うかな。あ、メーラーのインストールがまだだった…

2015-12-04

cuDNNのサンプルコードが動く様になった

開発日記

cuDNNの開発環境を構築しようとしていたらOSがお亡くなりになったので、今日は再インストールと開発環境の構築をしました。 http://d.hatena.ne.jp/torutk/20100927/p1 とりあえず、cuDNN v3にはCUDA 7.0とVisual Studio 2010が必要そうなので、後者は上記の…

2015-11-29

Deep Learningに挑戦中

開発日記

これまで使用していた線形の評価関数がどっかバグってるって言うか複雑すぎてテスト出来ねーしそもそもどうやってテストすりゃ良いかも分かんないッスわ・・・・・・と色々考えた結果、局面の生データをそのままDeep Neural Networkにぶち込んで学習させりゃ…

2015-11-29

第9回UEC杯5五将棋大会バージョンのバイナリを公開します

コンピュータ将棋

Gasyou9_9.0.37.zip 5五将棋用の思考エンジンです。プチ将棋等のGUIと組み合わせてご使用下さい。 x64版のWindows（Windows 7 Professional x64で動作確認しました。） POPCNT命令をサポートしたCPU（多分、初代Core i7/5/3以降） 6.6GB以上の空きメモリが…

2015-11-25

GAT杯

コンピュータ将棋

http://minerva.cs.uec.ac.jp/~uec55shogi/wiki.cgi?page=%C2%E8%A3%B1%B2%F3GAT%C7%D5%A3%B5%B8%DE%BE%AD%B4%FD%C2%E7%B2%F1 第1回GAT杯5五将棋大会の告知ページが出来ていました。参加したいけど、平日（水曜）の午後かぁ… 水・木と有給取っていくのも無…

2015-11-24

評価関数のプロトタイプ作成

開発日記

詳細は後日書きますが、評価関数を全面的に書き換え中。んで、現在はランダムにパラメータを初期化して、局面評価を行う機能だけ実装完了。今回はAVX命令を多用していますが、メモリアクセスのパターンを変えるだけで速度が一桁向上したりして、開発してい…

2015-11-22

UEC杯5五将棋大会に行ってきました

コンピュータ将棋

運営の皆様ありがとうございました。開発者の皆様、色々と楽しかったです。 GA将!!!!!!!!!の戦績ですが、目標だった1/128里眼には勝ったものの、他のソフトに負けて8勝1敗で2ソフトが並ぶ形に。で、1位決定のプレーオフで負けて最終的には2位に入賞しました…

2015-11-21

電王トーナメント行ってきました

コンピュータ将棋

第3回将棋電王トーナメント、今日の予選に行ってきました。運営・ご協力の皆様ありがとうございました。開発者の皆様、お疲れ様でした。結果は公式サイトでそのうち公開されると思いますが、GA将!!!!!!!!!は3勝5敗の19位で予選脱落となりました。順位に関…

2015-11-16

今更また新しい学習ルーチンの実装中

開発日記

PGLeafをオンライン学習化した上で、Dropoutを実装。 4x4リバーシでザッとテストした感じ、従来より収束が速くなった感じなので、期待しています。んで、今までは全幅3手＋静止探索10手*1だったんですが、全幅部を5手に延長。色々と理由はあるんですが、当…

2015-11-15

電王トーナメント参加チーム

コンピュータ将棋

http://www.shogi.or.jp/topics/event/2015/11/30_6.html 電王トーナメントの参加チームが発表されていますが、これは決勝トーナメントは無理そうですね。という訳で、目標は30チーム中15位以上、でしょうか。まぁ、今更大幅な棋力向上は無理そうなので、…

2015-11-15

GPW杯将棋大会でGA将!!!!!!!!!が優勝

コンピュータ将棋

http://www.computer-shogi.org/blog/gpw2015_computer-shogi_competition/ 私は現地に行けなかったので、芝浦将棋Jr.チームの和田さんに代理操作を頼んでいたのですが、4チーム参加でGA将!!!!!!!!!が3勝し優勝したとの事です。参加チームが少なかったとは…

2015-11-12

バグってる？そう思っていたらバグってた

開発日記

えー、試しに三目並べで一晩学習させたんですが、収束しませんでした。 …さて、テスト再開しますか。

2015-11-09

久々に学習ルーチンの実装中

開発日記

合議用に複数の評価関数を並行して学習するもので、Dropout*1を使用します。概要は下記の通り。合議クライアント8個は、全て同じ評価項目の評価関数を用いる。 8クライアントのリーグ戦の結果から学習する。学習アルゴリズムはPGLeaf。各クライアントは、…

2015-11-07

割と安定してきた＆今更PGOなるものを試してみた

開発日記

とりあえず、一晩連続対局してもエラー発生やアサーションに引っかかる事は無くなりました。んで、久々にPGOを実験。環境はWindows 7 Pro x64にVisual Studio 2013、Core i7 4930K。適当に選択した8手目・40手目・74手目の局面でのNPSの変化は下記の通り。…

2015-11-04

まだまだバグるよ〜〜

開発日記 floodgate

大絶賛テスト＆デバッグ中です。今週末にはGPW杯があるって言うのに… んで、今日は一旦勝ちを読み切った後に、次の手番で読み切れない現象に対応（またかよ）。詰将棋ルーチンとかグローバル詰みテーブルとかをいじったので、一晩走らせて様子を見てみます。…

2015-11-03

弱くなってる原因、分かったかも

開発日記

昨夜に、連続対局中に勝ちを読み切った後の局面で「勝ち」以外の評価値になったらエラーを吐く、というコードを仕込んで、一晩走らせてみました。んで、結論。合議サーバのマルチスレッド絡みのバグでした。簡単に書くと、探索開始（合議クライアント＆詰…

2015-11-02

あれ、弱くなってる？

開発日記

Bonanza 6.0（5手読み）相手に本将棋で連続対局させてみたんですが、結果は210-2-234で勝率47.3％。前は300-5-278で勝率51.9％だったので、明らかに弱いですね。 …エンバグしてないか、5五将棋モードでssp相手に検証してみます。

2015-10-31

今週末にやるべき事

開発日記 TODO

本将棋モード時のDropoutの挙動を修正フィッシャクロックルールの追加時間を思考時間制御に反映（GPW杯対策）とりあえず、これだけやれば大丈夫かな。

2015-10-31

やっちまったぁ！！

開発日記 floodgate

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2015/10/31/wdoor+floodgate-600-10+Gasyou_Core-i7-5960X_8c16t+baby_magnum+20151031050004.csa 勝ちを読み切った瞬間に投了しちゃいました＿|￣|○ 原因はタイミング依存の単純なバグだったんで、現在は修正済み…

2015-10-30

思考時間のマージン調整

開発日記 floodgate

time up連発してたんで、思考時間のマージンをやや長めに調整したバージョンに差し替えました。 20:00の回から反映されるはずです。

GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

2015-01-01から1年間の記事一覧

将棋用評価関数、半分位実装完了

CNN(Convolutional Neural Network)を使ってみた

選手権の宿、確保完了

選手権の申し込み完了

冬休みの宿題

ようやく進展

次回選手権までのロードマップ

大須へ行ってきました

WindowにCaffeをインストールしてみた

4x4リバーシの学習に成功

大体完了

cuDNNのサンプルコードが動く様になった

Deep Learningに挑戦中

第9回UEC杯5五将棋大会バージョンのバイナリを公開します

GAT杯

評価関数のプロトタイプ作成

UEC杯5五将棋大会に行ってきました

電王トーナメント行ってきました

今更また新しい学習ルーチンの実装中

電王トーナメント参加チーム

GPW杯将棋大会でGA将!!!!!!!!!が優勝

バグってる？そう思っていたらバグってた

久々に学習ルーチンの実装中

割と安定してきた＆今更PGOなるものを試してみた

まだまだバグるよ〜〜

弱くなってる原因、分かったかも

あれ、弱くなってる？

今週末にやるべき事

やっちまったぁ！！

思考時間のマージン調整