大枠は出来てたんですが、評価関数として使う為の細々した機能が抜けてました。 という訳で今日はその辺を実装。 現在デバッグモードで強化学習中。30分で100手しか進んでませんorz 1手全幅+制止探索4手なのに…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。