以前やってたのだと、パラメータと得られる報酬の期待値のグラフが単峰性になって、ちょっとテストとしては簡単すぎると思い、問題を修正してリトライ。
んで、まずはGAの個体数と世代更新の間隔*1から。
おおざっぱな傾向としてはこんな感じ。
- 個体数に対して間隔が狭いと*2収束後の挙動に問題あり
- 間隔が広い方が収束後の挙動は良いが、収束は遅くなる
- 非定常環境*3だと、間隔狭めの方が良い
今日試した限りでは、16個体で間隔50ってのがベストっぽいです。
さて、後は世代更新で残すエースの数と突然変異率を調整して、それからもう一度個体数・間隔が上の値でいいかチェック。それが終わったらリバーシでテストしてみます。