GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2015-08-01から1ヶ月間の記事一覧

合議用PGLeafでの学習を開始

PGLeaf単体では行き詰まり気味なので、合議用に複数の評価関数を同時並行して学習するルーチンを引っ張り出してきて学習開始。 んで、以前は評価項目ごとにOn/Offを切り替えて複数の評価関数を作成していましたが、それを変更。 今度は、評価項目ごとの重み…

RMSPropをすっ飛ばして、Adamを実装

してみました。 とりあえず一晩走らせてみて、効果がある様なら採用します。 んで、powの計算がやったら重かったので高速化するコードを探して真似てみたりとか。なんか、そっちの方が時間かかってました。

AdaGradとRMSProp

http://qiita.com/skitaoka/items/e6afbe238cd69c899b2a 上記サイトを参考に勉強していますが、ようやくAdaGradとRMSPropの違いが理解出来ました。 大雑把に書くと、AdaGradは「勾配の累積が大→学習率小」なので、「学習初期に大きく値を動かしたパラメータ…

評価項目ごとのテスト

教師ありの方策勾配法で、特定の評価項目*1を無効にした場合の学習の成否を確認してみました。 んで、結果として「大駒の自由度」と「二駒の相対位置」を無効にした場合にそこそこちゃんとした結果になりました。 逆に言うと、上の2つのどこかにバグが有る可…

メタ学習の実装を検討中

PGLeafのテストも行き詰まりがちなのと、もうすぐ盆休みでまとまった時間が取れそうなので、デッカイ改良を検討中。 んで、表題のメタ学習。 一般的に、学習ルーチンの挙動を決めるパラメータを「メタパラメータ」とか「ハイパーパラメータ」と呼びます。例…