2008-01-13から1日間の記事一覧
あと4ヶ月でやらなきゃならない事。 ちゃんとUSI対応 学習ルーチンの仕上げ 学習させる(2〜3ヶ月は必要?) デバッグ チューニング マジやばいです。
評価関数修正後に学習率を0.1,0.05,0.01,0.005の4パターン走らせてたんですが、パラメータをよく見てみるとどれも変に学習していました。 具体的に書くと、駒割や王将の移動範囲はそこそこまともなんですが、絶対位置や相対位置のパラメータは変になっている…
あと4ヶ月でやらなきゃならない事。 ちゃんとUSI対応 学習ルーチンの仕上げ 学習させる(2〜3ヶ月は必要?) デバッグ チューニング マジやばいです。
評価関数修正後に学習率を0.1,0.05,0.01,0.005の4パターン走らせてたんですが、パラメータをよく見てみるとどれも変に学習していました。 具体的に書くと、駒割や王将の移動範囲はそこそこまともなんですが、絶対位置や相対位置のパラメータは変になっている…