GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2011-03-27から1日間の記事一覧

近況

Averaged Perceptronを使って色々やってます。TDLeaf(λ)とか方策勾配法でやったり、学習用の自己対戦時に平均化されたパラメータを使ったり。 んで、Averagedでやってみた感じですが、通常より学習率高めにしても平均化されるおかげでパラメータの変化が安定…