GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

ぼくのかんがえたさいきょうのがくしゅうあるごりずむ

 上で書いたGA+強化学習の大雑把な構成。GAはIAになるかもしれませんが、まぁ基本は一緒です。

  1. ランダムな値で初期化した個体*1群を生成する。
  2. 個体群をスイス式で何回戦か*2対局させ、その後PGLeafでパラメータを修正する。
  3. 2.の対局結果(順位)を適応度*3として、次世代の個体群を生成する。
  4. 2.に戻る。

 うん、単純ですね。シンプルなのは良い事です。

 この方式だと、対局結果を評価関数パラメータの修正とGAの世代交代の二つの処理に利用可能で無駄が無いですし、我ながら良い構成かと自画自賛してみます。

 GA部分は大域的な探索をメインにしたいんで、個体数を100前後・突然変異率高めの設定で動かせば良いかな? エースは5〜10個体程度残せば、途中で急に弱くなる事も無いでしょう。多分。

 …まぁ、こういうのは実際に動かしてみると欠点がボロボロ出て来て、最終的には継ぎ接ぎだらけの応急処置バージョンになるのが常なんですがね。

*1:評価関数パラメータ

*2:10〜100位か?

*3:個体の良し悪しを示す値