GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2015-07-01から1ヶ月間の記事一覧

Windows 10アップグレードの記録

コンピュータ将棋の方でネタがないのでPC関連の話でも。 という訳で、表題の通りWindows 10にアップグレードしました。 つっても、いきなり開発用マシンとか学習用マシンをアップグレードするのはリスキーなので、万一の時一番影響の無いfloodgate常駐用マシ…

ドロップアウトの効果

試しにP=0.5でDropoutを実装してみました。 んで、駒の価値が急に減少する事は無くなったので、ある程度の効果はありました。 ただ、駒の価値が金<龍<馬になっていたり、棋譜との一致率が微妙に下がったりという状況です。 試しにLesserkaiと対局させると…

テスト中

とりあえず、学習用棋譜約5万局から、20局分は汎化誤差検証用に取り出して学習する様に修正。読み通り過学習なら、汎化誤差はどっかのタイミングで大きくなっていくはずです。 んで、現在バグの再現&状況検証中なんですが、ひたすら時間かかってます。 …こ…

Deep Learningやってる人を発見

http://burninglifegoaroun.wix.com/jokersyogi Deep Learning+強化学習(TD(0))で将棋の学習をされている様です。 これは、うかうかしてるとあっという間に追い越されそうですね。

バグってる

棋譜との一致率。 駒割のパラメータ。 棋譜からの学習をやってるんですが、何か変。大駒の価値が、一旦大きくなってから小さくなるという現象が起きています。 棋譜との一致率は順調に(?)向上しているので、オーバーフィッティングかなぁ… さて、こういう…

棋譜からの学習にトライ

探索ルーチン・評価関数のテストも兼ねて、本将棋で棋譜からの学習を実装してみました。 正直、邪法に手を染めた感もあるのですが、これで強くならなければどっかおかしいって判断出来ますし。 手法に関しては、山本@ひまわりさんのやり方をマルっとパクり…

Knights Landing情報

http://news.mynavi.jp/series/isc2015_xeon_phi/001/ 詳細はリンク先を見てもらうとして、個人的に一番気になるのはSelf-Bootという、このチップ単体でOSが起動出来る点ですね。 自作向けに登場すれば面白いと思うのですが、どうなりますかね。

Visual Studio 2015リリース

https://www.visualstudio.com/downloads/download-visual-studio-vs とりあえずCommunityとLanguage Packをダウンロードして、日本語表記に変更出来るまでは確認。 GA将もVS2015で開発する様に移行する予定ですが、とりあえず今日は別件の改修中なので後回…

Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models

http://arxiv.org/pdf/1507.00814.pdf

オンラインPGLeafにL2正則化を実装

本将棋をオンラインPGLeafで学習させたのをsspと連続対局させていますが、序盤から評価値が1000点を超えたりしていて、ちょっとおかしい状態です。 んで、表題のL2正則化を実装して、現在5五将棋でテスト用に学習中。 大体良さ気な正則化係数が分かったら、…

PGLeafとSR-PGLeafの比較

それぞれ自己対局100万局で学習させた結果の、対sspの勝率です。横軸が自己対局数で、縦軸が対ssp(本将棋モード)の勝率です。 んで、残念ながらPGLeafとSR-PGLeafの差はほとんど無いです。 以前に実験した時は大分差があったと思っていたのですが、たまた…

Accelerating Stochastic Gradient Descent via Online Learning to Sample

http://arxiv.org/pdf/1506.09016.pdf