数パターンを自動実行出来る様にしたんで、一晩動かせばOKのはず。まずはパラメータ調整をちゃんとやります。 それから、リバーシもとりあえず学習用マシンで動かしときます。メタ強化学習あり・無しで何か差が出ると嬉しいなぁ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。