2013-02-03から1日間の記事一覧
まずは二駒の絶対位置関係の評価を実装して、それで方策勾配法(PGLeaf)を使って学習させる。 んで、それと並行してバックアッププランとしてDeep Learningの評価関数を実装。こっちをTDLeaf(λ)で学習させる予定。 最終的に、強かった方を選手権に出すって…
シード組が2チームキャンセルすると、GA将!!!!!!が二次シードって… どう考えてもおかしいですよ。
if( exp ) return false; を if( exp ) false; と書いていてバグってた。で、そのデバッグに1時間近くかかってた。 死にたい _| ̄|○