GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

上の案をもうちょっと具体的に考えてみた

学習の流れ

  1. 乱数で初期化した個体群*1を生成する
  2. 全個体対象として、スイス方式で対局の組み合わせを決定し、対局しながらパラメータ修正を行う。
  3. 2.の対局での勝率を遺伝子の適応度*2としてGAでパラメータ修正を行い、新たな個体群を生成する。
  4. 2.に戻る。

GA部分の操作

交叉

 経験上、一様交差が優秀だったので、とりあえずそれでやってみる。

突然変異

 予め遺伝子の各値の平均・分散を求めておき、それを使って乱数で値を決める。

 突然変異率はテキトーに実験して決める。

選択戦略

 とりあえずトーナメント選択でやってみる。

その他

 少しだけエリート選択*3をやってみる。

要実装項目

  • GA部分(改めて作り直し)
  • スイス方式でのマッチメイク(新規作成)
  • レポート収集系の修正

 あれ、意外と項目少ないかも。 

おまけ

この手法だとLMRのパラメータとかも学習出来るかも。

ただ、その辺は手調整である程度まともな値が決めれるし、学習する意味はあまり無いかも。

*1:評価関数のパラメータベクトルの集合

*2:遺伝子の良し悪しを評価する値

*3:適応度の高い個体は、そのまま次の世代の個体群に残す