王手将棋で方策はソフトマックス、評価関数は先後非対称の絶対位置評価のみって条件だと、ソフトマックスの温度次第ではちゃんと収束する様です。 ただ、方策をεグリーディーにしたり、評価関数で駒割とか先後対称の絶対位置評価とかの(今の対局条件では)…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。