GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2014-08-01から1ヶ月間の記事一覧

Haswell-E正式発表&発売

http://news.mynavi.jp/special/2014/5960x/ マルチスレッド性能が気になるのでCineBenchの結果だけざっと見てみましたが、マルチスレッド処理時にi7 4960Xから5960Xの性能向上率は32%。やっぱり、コア数多いのが効いていますね。 GA将の学習ルーチンはマル…

gps_normalに多少勝てる様になってきた

現時点での履歴は、2勝19敗で勝率10%。 前は本当にたまに(1%とか)しか勝てなかったので、かなり嬉しいです。 今の学習ルーチンの改良が成功したら、gps_normalと互角位にはならないかなぁ…

バグに悩むこと一週間、発見してから修正は一瞬

え〜、上で書いたバグ、原因判明&修正完了。 局面の評価値をシグモイド関数に通して予測勝率に変換している部分があったんですが、コードの2箇所で2回シグモイド関数に通してました。 そりゃ、ちゃんとした動作にならない訳ですよ。はぁ… んで、リバーシで…

まだまだ改良中

SR-PGLeafの改良ですが、リバーシでバグが起きる事が判明して、現在原因の調査中。 なんだろう、コーディングのミスって言うより、アルゴリズム自体が間違ってる可能性高そうだな。

SR-PGLeafの改良中

一応実装は終わって、三目並べと4x4リバーシでテスト。 んで、指し手に応じてサブ報酬(ボーナス)を与える様にしてみたんですが、効果がある様な無い様な… 収束が速くなったりはしないんですが、収束後の挙動が安定するという予想外の結果になりました。 ま…

VS ssp(本将棋モード)

全幅1手で50万局+全幅2手で23万局のパラメータ。 結果は362-0-34で勝率91.4%、95%信頼区間は88.2〜94.0。 わりかし良い感じなので、14:00の回からfloodgateに投入します。

Windows 7上にLaTeX環境構築

一個つまずいたのでメモ。 dviファイルを作れるんだけど、ダブルクリックしてdvioutで表示しようとすると、半角文字だけ表示されない。 で、dvioutのOption->Setup Parameters->Font->TEXROOTを見る… 「C:\w32tex\share\texmf-dist\fonts」が抜けてました _…

VS ssp(本将棋モード)

SR-PGLeafで全幅1手でザクッと学習*1後、全幅2手でパラメータを引き継いで学習したバージョン。 んで、現在32-0-8で勝率80%。まだまだですね。(まぁ、対局数が少ないんでそもそも80%って値自体信用出来ませんが。) 5五将棋では勝率90%弱まで行ったんで…

あ…

OSの再インストールしてから、LaTeXの環境作ってなかった… という訳で、現在環境構築中。時間かかりそうだなぁ…

よし

とりあえず、合議用評価関数を方策勾配法(SR-PGLeaf)で学習する為のパラメータ更新則を計算しよう。 んでもって、連休後半で一気に実装…は、無茶かな? まぁ、出来る所までやるつもりで。

さて

今日から盆休み(5連休)な訳ですが、何しようか? とりあえずGA将!!!!!!!!の開発をするのは確定としても、選択肢が色々。 探索ルーチンの強化(本将棋で全幅3手位で学習させたい) 方策勾配法での合議用評価関数等の学習 評価関数の改良(非線形化・評価項目…

下位が充実してて嬉しい

ちょっと前は上位のソフトにボコられるだけだったので、そこそこ勝てる状況になってきたのは嬉しいです。

ノイズ付加探索をリトライ

本将棋での学習結果が芳しくないので、ノイズ付加探索を再度実装・テスト中。 んで、とりあえず5五将棋で効果を見ていますが、対sspで351-?-80で勝率81.4%。まだまだです。 昨夜からノイズの与え方を少し修正したバージョンを学習させてるんで、今度はそっ…

DDR4メモリの予価

http://northwood.blog60.fc2.com/blog-entry-7675.html Crucial製のDDR4 32GB(8GB*4)が5万円台だそうで、案外安いですね。 となると、Core i7 5960Xが11万円前後、マザーが5万とすると、トータル21万で8コア・32GBメモリですか。 結構魅力的ですねぇ。

第2回将棋電王トーナメント エントリー完了

http://ex.nicovideo.jp/denou/tournament/ とりあえず申し込みました。 …が、前回選手権からの棋力向上は現時点では無し。最悪、選手権バージョンのプログラム・パラメータで参加です。

第2回将棋電王トーナメント

http://ex.nicovideo.jp/denou/tournament/ 参加しようと思ってるんですが、UI・通信周りが意外と面倒かも。 まず、参加ソフト(指し手生成部+インタフェース部)に関して、重要と思われる事柄。 CSAサーバプロトコル+拡張モードでの評価値・読み筋の送信…

本将棋での学習中

現在、SR-PGLeafで本将棋の学習中です。 んで、学習途中の終局図を見ると、なんとなく囲っている(らしい)形跡があります。 156200局終了 +---+---+---+---+---+---+---+---+---+ |v香| | |v王| |v桂|v金| |^龍| +---+---+---+---+---+---+---+---+---+ | |…

VS ssp(5五将棋モード)

SR-PGLeafで55万局学習後のパラメータ。学習時の探索は全幅3手+静止探索6手。 結果、732-?-87で勝率89.4%、95%信頼区間は87.1〜91.4。 ちなみに2012年のGPW杯では、対sspの勝率70%前後の思考ルーチンで3位だったので、ひょっとしてこのパラメータなら優勝…

VS ssp(5五将棋モード)

上で書いた、バグ修正後に全幅3手+静止探索6手で学習したパラメータ。 結果は454-0-88で勝率83.8%、95%信頼区間は80.4〜86.8。 とりあえず、前回の選手権時とほぼ同じ強さになったので、でかいバグは取れたでしょう。多分。

VS ssp(5五将棋モード)

SR-PGLeafで33万局ほど学習したパラメータ。学習時は、昨日書いた静止探索のバグが有るバージョン(連続対局はバグ修正後)。 で、結果。263-0-77で勝率77.4%、95%信頼区間は72.5〜81.7%。 次は、バグ修正後に学習し直したパラメータでやってみます。

置換表にバグ発見

静止探索中で置換表に格納する詰・不詰みの情報が変になるバグを発見&修正。 んでもって、学習結果がおかしくなってた可能性大なので、学習もやり直し。 とりあえず全幅3手で明日朝まで学習させてみます(@5五将棋モード)。

サブディスプレイの調子が悪い

なんか、水色のドットが頻繁に画面上に出たり消えたりする… 上手く言えないけど、常時点灯ドットみたいな感じ(ただし、点灯位置が時間経過によって変化する)。 多分、壊れる兆候だろうなぁ。 まぁ、サブディスプレイなんで最悪壊れても被害は少ないですし…