2007-09-25 上の記事の補足 開発日記 というか、訂正。 本来はメタ強化学習一発で解決したかったんですが、それを何とかしようとしてるうちにメタパラメータ調整の勘所が分かってきました。 これは、メタメタパラメータ*1をメタ強化学習で調整したかったのですが、色々工夫しているうちにメタメタパラメータ調整の勘所が分かってきた、の間違いでした。 *1:メタエージェントの動作を決めるパラメータ