成駒の価値の学習が遅いので、重ね合わせを実装してみました。 で、一度サクッと学習させたいので探索を静止探索のみ、評価項目を二駒絶対以外にして学習用マシンに投入。2晩ほど走らせれば学習完了するはずです。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。