GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-07-01から1日間の記事一覧

先後対称の評価関数に戻してリトライ

報酬の与え方を少し変える(一手指して勝てなかった時に与えるマイナスの報酬を、先後非対称の場合より絶対値を大きくする)のと温度を少し上げるのが効果的ッポイです。 とりあえず数通りのパラメータで一晩動かしてみて、上手くいったら次に行きます。 現…

実験結果&考察

温度固定でのソフトマックス手法は、温度次第では成功でした。 気になる点は二つほど。 温度を徐々に下げるよりも温度固定の方が収束が速い(単にパラメータ設定が良かっただけ?) 温度が0.01では成功し、温度0.02ではランダム指しと変わらない結果になる(…