GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2012-02-14から1日間の記事一覧

そろそろGA+強化学習を試すべきか?

http://www.logos.ic.i.u-tokyo.ac.jp/~yano/PDF/GI21_dist.pdf GA*1+TD(λ)で評価関数のパラメータを学習したって先行事例もありますし、これをベースにやってみようかと検討中。 GAは大域的な探索が得意でTD(λ)とか方策勾配法は局所的な探索が得意なんで、…

設定を変えて再投入

前の探索条件(全幅2手+静止探索8手)だと、24時間あたり900局しか自己対戦が出来なかったんで、これじゃぁ多分選手権には間に合わないです。 という訳で、全幅1手+静止探索6手に減らした上で、初期温度を0.02に変更して再投入。ざっと10倍位は速くなって…