リーチ判定ルーチン(仮称)実装完了
将棋で言うと、一手詰めと頓死判定が出来る様になったレベルです。
んで、結果。収束するまでの対局数が約7万→約3万5千に半減。もうちょっと減ると思ってたけど、見込みが甘かったですねぇ。バグかもしれないんで、も一回ソースを見てみます。
けどまぁ、これで二人で対局するゲームでの強化学習の基本は出来たかと思います。
将棋で言うと、一手詰めと頓死判定が出来る様になったレベルです。
んで、結果。収束するまでの対局数が約7万→約3万5千に半減。もうちょっと減ると思ってたけど、見込みが甘かったですねぇ。バグかもしれないんで、も一回ソースを見てみます。
けどまぁ、これで二人で対局するゲームでの強化学習の基本は出来たかと思います。