GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-02-03から1日間の記事一覧

今後の方針

まずは二駒の絶対位置関係の評価を実装して、それで方策勾配法(PGLeaf)を使って学習させる。 んで、それと並行してバックアッププランとしてDeep Learningの評価関数を実装。こっちをTDLeaf(λ)で学習させる予定。 最終的に、強かった方を選手権に出すって…

WCSC23の参加者リスト来てた

シード組が2チームキャンセルすると、GA将!!!!!!が二次シードって… どう考えてもおかしいですよ。

二駒絶対評価のデバッグ中

if( exp ) return false; を if( exp ) false; と書いていてバグってた。で、そのデバッグに1時間近くかかってた。 死にたい _| ̄|○