VAPS(Value And Policy Search)は一旦やめて、探索ルーチンのリファクタリングに着手。 現時点で各種枝刈りを実装して、自己対局での学習に使える様にはなりました。 という訳で、5五将棋モード・全幅5手+静止探索6手の設定で学習用マシンに投入。 しばらく…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。