試しに、駒割のみ適当に初期化して、後の三駒関係+αはごく小さな乱数で初期化した評価関数を使って、sspと対局させてみました。 んで、驚愕の事実!!! 2勝21敗で勝率8.7%でした!!! 全く勝てないかと予想してたんですが、駒割のみでも意外と行けるもん…
パラメータの更新回数を、本譜の手のPV Leafでのみ更新する様に変更。 ミニバッチサイズ*1を100→1000に変更。 Bonanza 6.0のFV_SCALEに相当する値*2を微調整。 王将の移動可能範囲評価で特徴量計算式を修正。 んで、現在5時間ほど学習させて、駒割はほぼ収束…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。