ぼくのかんがえたさいきょうのがくしゅうあるごりずむ
上で書いたGA+強化学習の大雑把な構成。GAはIAになるかもしれませんが、まぁ基本は一緒です。
- ランダムな値で初期化した個体*1群を生成する。
- 個体群をスイス式で何回戦か*2対局させ、その後PGLeafでパラメータを修正する。
- 2.の対局結果(順位)を適応度*3として、次世代の個体群を生成する。
- 2.に戻る。
うん、単純ですね。シンプルなのは良い事です。
この方式だと、対局結果を評価関数パラメータの修正とGAの世代交代の二つの処理に利用可能で無駄が無いですし、我ながら良い構成かと自画自賛してみます。
GA部分は大域的な探索をメインにしたいんで、個体数を100前後・突然変異率高めの設定で動かせば良いかな? エースは5〜10個体程度残せば、途中で急に弱くなる事も無いでしょう。多分。
…まぁ、こういうのは実際に動かしてみると欠点がボロボロ出て来て、最終的には継ぎ接ぎだらけの応急処置バージョンになるのが常なんですがね。