GA将?開発日記~王の理とは~

ネタ勢最強を目指して絶賛開発中。

2015-08-16から1日間の記事一覧

AdaGradとRMSProp

http://qiita.com/skitaoka/items/e6afbe238cd69c899b2a 上記サイトを参考に勉強していますが、ようやくAdaGradとRMSPropの違いが理解出来ました。 大雑把に書くと、AdaGradは「勾配の累積が大→学習率小」なので、「学習初期に大きく値を動かしたパラメータ…

評価項目ごとのテスト

教師ありの方策勾配法で、特定の評価項目*1を無効にした場合の学習の成否を確認してみました。 んで、結果として「大駒の自由度」と「二駒の相対位置」を無効にした場合にそこそこちゃんとした結果になりました。 逆に言うと、上の2つのどこかにバグが有る可…