学習時にPV末端まで進める処理の最中に差分計算した評価値が一から計算した評価値と一致しないという、ちょっと前に見つけたバグ。PV末端まで進める前に差分計算の初期化コードを書いたら、何故か起きなくなりました。 原因が不明なのが気持ち悪いんで、今夜…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。