ヤバい、何のアイデアも出ない
方策勾配法のデバッグは相変わらず成果無しだし、どうしよう…
残タスクとしては合議方策勾配法のマルチスレッド化して、軽い評価関数はより深く読んで学習出来る様にするってのは残ってるんですが、素の方策勾配法が上手く行ってないのに合議有りで学習して上手く行く気はしないし…
う〜ん、どうしたもんかなぁ。
方策勾配法のデバッグは相変わらず成果無しだし、どうしよう…
残タスクとしては合議方策勾配法のマルチスレッド化して、軽い評価関数はより深く読んで学習出来る様にするってのは残ってるんですが、素の方策勾配法が上手く行ってないのに合議有りで学習して上手く行く気はしないし…
う〜ん、どうしたもんかなぁ。