2012-03-14 うーん、おかしい? 開発日記 合議無しのシングルエンジンでの方策勾配法を走らせてたんですが、駒割のグラフが収束していない気配があります。てか、このままどんどん発散しそうな勢い。 条件は方策勾配法・線形評価関数で、歩の価値を10に固定してあります。あと、収束を早める為に慣性項を減衰率0.9で使用。グラフは横軸が対局数÷100、縦軸が駒の価値です。 TDLeaf(λ)だとこれ位対局すれば駒割は収束してたはずですが、変ですね。 てか、歩が10点で龍が380点ってのはどう考えても異常な様な… うーん、どっかバグってる?