Deep Learningは諦めた
私の実装だと、主に学習速度の面で問題があるので、とりあえずお蔵入り。
んで、PGLeaf(方策勾配法+αβ探索)を実装し直す事に。
前の実装は、拡張に拡張を重ねて見通しが悪くなってたんで、思い切って書き直します。
今日中にはリバーシで動作確認する所まで持って行きたいけど、可能なんだろうか…
私の実装だと、主に学習速度の面で問題があるので、とりあえずお蔵入り。
んで、PGLeaf(方策勾配法+αβ探索)を実装し直す事に。
前の実装は、拡張に拡張を重ねて見通しが悪くなってたんで、思い切って書き直します。
今日中にはリバーシで動作確認する所まで持って行きたいけど、可能なんだろうか…