2012-11-23から1日間の記事一覧
方策勾配法のデバッグは相変わらず成果無しだし、どうしよう… 残タスクとしては合議方策勾配法のマルチスレッド化して、軽い評価関数はより深く読んで学習出来る様にするってのは残ってるんですが、素の方策勾配法が上手く行ってないのに合議有りで学習して…
方策勾配法のデバッグは相変わらず成果無しだし、どうしよう… 残タスクとしては合議方策勾配法のマルチスレッド化して、軽い評価関数はより深く読んで学習出来る様にするってのは残ってるんですが、素の方策勾配法が上手く行ってないのに合議有りで学習して…