以前もやった事のある方式ですし、そんな複雑な訳でも無いのでサクっと完了…したって事はなく、微妙につまずきつつ何とか実装しました。 学習用マシンは4コア8スレッド動作なので、以前より大分対局数は稼げてます。 問題は収束速度なんですが、こればっかり…
学習経過のグラフはこんな感じ。 まだ歩の価値が高すぎたりしますが、もうちょっと時間をかければちゃんとした値に落ち着くはず(学習用マシンの経過を見る限りでは)。 んで、どうもグラフを見てると収束が遅い様なので、ここいらで並列化してみます。 探索…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。