GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

メタ強化学習の動作確認完了

とりあえず10本腕バンディット問題を解くエージェントのメタパラメータ調整をさせてみました。

んで、ちゃんと動いた事は動いたんですが、GAの個体数とか世代更新の間隔*1とかは、もうちょっとちゃんと設定しないといけない感じですね。

今は一パターンの設定で動かして、終わったらグラフを見るって感じで調整してるんですが、それだと非効率的なので。

これは、数パターン×数回まとめて実行して、結果はまとめて書き出すのが楽ちんですか。明日にでもサクッとやります。

*1:合計何回メタパラメータを使ったら世代更新するか