2007-08-17 メタ強化学習が上手くいかない・・・ 開発日記 昨日の夜からメタ強化学習をやってるんですが、上手くいかないです。 とりあえず、メタパラメータ*1手打ちよりちょっと劣るかな、という位には学習してくれるのですが、そこから学習が進みません。 なんか、根本的に勘違いしているか実装をミスってるか、そういう感じなのでもう一度ソースを全部見直してみます。 *1:学習率みたいな、学習器の動作を決めるパラメータ