2008-10-14 メタ強化学習の動作確認完了 開発日記 とりあえず10本腕バンディット問題を解くエージェントのメタパラメータ調整をさせてみました。 んで、ちゃんと動いた事は動いたんですが、GAの個体数とか世代更新の間隔*1とかは、もうちょっとちゃんと設定しないといけない感じですね。 今は一パターンの設定で動かして、終わったらグラフを見るって感じで調整してるんですが、それだと非効率的なので。 これは、数パターン×数回まとめて実行して、結果はまとめて書き出すのが楽ちんですか。明日にでもサクッとやります。 *1:合計何回メタパラメータを使ったら世代更新するか