GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

メタパラメータ調整が一部完了

以前やってたのだと、パラメータと得られる報酬の期待値のグラフが単峰性になって、ちょっとテストとしては簡単すぎると思い、問題を修正してリトライ。

んで、まずはGAの個体数と世代更新の間隔*1から。

おおざっぱな傾向としてはこんな感じ。

  • 個体数に対して間隔が狭いと*2収束後の挙動に問題あり
  • 間隔が広い方が収束後の挙動は良いが、収束は遅くなる
  • 非定常環境*3だと、間隔狭めの方が良い

今日試した限りでは、16個体で間隔50ってのがベストっぽいです。

さて、後は世代更新で残すエースの数と突然変異率を調整して、それからもう一度個体数・間隔が上の値でいいかチェック。それが終わったらリバーシでテストしてみます。

*1:メタパラメータを何回使ったら世代更新するか

*2:大体、間隔が個体数の2倍を切ると

*3:時間経過にしたがって、行動と得られる報酬の関係が変化する環境