GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2015-12-01から1ヶ月間の記事一覧

将棋用評価関数、半分位実装完了

まだ駒の価値を取り出したりとかは出来ないんですが、とりあえず対局して学習出来る所までは持って行きました。 ただ、NPSが8000前後*1で、学習速度も1日1万局には届かなそうな感じです。 と言う訳で、学習時に静止探索内で枝刈りするとか、何らかの工夫は必…

CNN(Convolutional Neural Network)を使ってみた

5x5の三目並べで、Convolution Layerの有無で収束速度がどの程度違うかを実験。 で、ざっと比較すると収束までの対局数が25%前後まで減少。かなり使えそうです。 と言う訳で、正月休み中には将棋用評価関数にもこれを応用してみたいですね。

選手権の宿、確保完了

http://travel.rakuten.co.jp/HOTEL/28640/28640.html 会場近くの「ビジネスインオカベ」というホテルにしました。 前々日までのキャンセルならキャンセル料不要みたいですし、残室少なかったのでとりあえず確保。 後は、行きの新幹線を早めに予約しないと、…

選手権の申し込み完了

http://www.computer-shogi.org/wcsc26/ 先ほど第26回世界コンピュータ将棋選手権に申し込みしました。 現時点ではまだまだ弱いですが、あと4ヶ月間頑張ります。

冬休みの宿題

もうすぐ正月休みなんで、その間に基礎データを収集しようと思って、その課題。 問題設定 盤の大きさをn*nの三目並べとする(4≦n)。 どちらかのプレイヤーが自分の石を3つ直線上に連続して並べたら、そのプレイヤーの勝ち。 それ以外は通常の三目並べと同じ…

ようやく進展

Windows上でCaffeを使ってsin関数を近似する所までは成功。 自前のテスト用ドライバとの結合も上手く行ったので、次はもうちょっと複雑な関数の近似をさせてみます。 んで、明日はDeepTDLeaf(λ)を実装して三目並べの学習を開始する予定。

次回選手権までのロードマップ

まず最終的な学習ルーチンの構成は「TDLeaf(λ)+Softmax方策+DNN評価関数」とします。 時間があればPGLeafにしたいのですが、流石にそこまでは無理そうです。 んで、上記構成を実現する為にやるべき事。 DNN評価関数の実装。 Convolutionは使用せずに、全結…

大須へ行ってきました

GeForce GTX 750 Tiのボードを購入。早速学習用マシンに挿しました。 本当は980 Tiを買うつもりだったんですが、適当に作ったベンチマークでは750 Tiと性能差3割程度だったんで、安い方を選びました。 という訳で、深層強化学習と心中する準備は出来たので、…

WindowにCaffeをインストールしてみた

http://g2sim.rosx.net/2014/09/777/ こちらのサイトを参考に。 環境はWindows 7 Pro x64/Core i7 4930K/GeForce GTX 750 Ti。 インストール順ですが、Visual Studio Express 2012→CUDA toolkit 6.5としないとNGでした。最初は「どっちでも良いだろ」と考え…

4x4リバーシの学習に成功

とりあえず、忘れない様にログの先頭を貼っときます。 19:58:08 @ wmain() > Version : GA将!!!!!!!!! 9.1.0 19:58:08 @ wmain() > ビルド日時 2015/12/08 19:58:06 19:58:08 @ wmain() > exe : ..\Release\gasyou9.exe 19:58:08 @ wmain() > CWD : C:\Docum…

大体完了

OSの環境構築、ほぼ完了。 後はVisual Studioの設定をして、それで開発体制は整うかな。 あ、メーラーのインストールがまだだった…

cuDNNのサンプルコードが動く様になった

cuDNNの開発環境を構築しようとしていたらOSがお亡くなりになったので、今日は再インストールと開発環境の構築をしました。 http://d.hatena.ne.jp/torutk/20100927/p1 とりあえず、cuDNN v3にはCUDA 7.0とVisual Studio 2010が必要そうなので、後者は上記の…