2010-11-28から1日間の記事一覧
対局数が足りてなくてまだ収束してない感じなので、自己対戦での学習時の探索深さを全幅0手+静止探索のみに変更。学習用マシンに投入しなおしました。
方策勾配法で学習したやつ。 結果、4-2-592で勝率…とかはいいか。割と論外な成績です。 さて、今日のバージョンだとどこまで改善されてるのか…
対局数が足りてなくてまだ収束してない感じなので、自己対戦での学習時の探索深さを全幅0手+静止探索のみに変更。学習用マシンに投入しなおしました。
方策勾配法で学習したやつ。 結果、4-2-592で勝率…とかはいいか。割と論外な成績です。 さて、今日のバージョンだとどこまで改善されてるのか…