GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2012-02-11から1日間の記事一覧

備忘録2

一箇所設定をミスってたんで、変更して再投入。 22:59:15 @ core::evl::LinearEvaluator3::LinearEvaluator3() > 学習率==0.001 22:59:15 @ core::evl::LinearEvaluator3::LinearEvaluator3() > 駒割 : 有効(差分計算) 22:59:15 @ core::evl::LinearEvalua…

備忘録

↑で書いた学習、忘れない様に設定をメモしてみます。 21:09:23 @ core::evl::LinearEvaluator3::LinearEvaluator3() > 学習率==0.001 21:09:23 @ core::evl::LinearEvaluator3::LinearEvaluator3() > 駒割 : 有効(差分計算) 21:09:23 @ core::evl::LinearE…

探索を深くして学習させてみます

ベイズ線形回帰とかカーネル法とか自然方策勾配とか色々試してみてもダメだったんで、前のまま(線形の評価関数+方策勾配法)で探索を深くしたバージョンをしばらく学習させてみます。 探索は全幅2手+静止探索一段目8手。これとは別に、方策内部で1手全幅…

自然方策勾配を実装してみました

多分、今のままの評価関数では動かないです、これ。 理由は動かしてみたら分かったんですが、パラメータ更新前に行列Zとqを使ってという式を計算する必要があります。 んで、対局中に一度も出現しなかった特徴があると、Zの対応する行・列が全て0になり、逆…