SR-PG行動期待値法 実装完了
結局、上の相互参照は無理やり解決して、とりあえず実装完了。今からテストします。
んで、当初は局面評価関数のみ学習させる予定でしたが、どうも着手評価関数も同時に学習しないと上手く動かないらしいので、いきなり両方同時学習する事に。
色々同時にやるとトラブルのもとですが、まぁ今回は必要なのでそうしましょう。
結局、上の相互参照は無理やり解決して、とりあえず実装完了。今からテストします。
んで、当初は局面評価関数のみ学習させる予定でしたが、どうも着手評価関数も同時に学習しないと上手く動かないらしいので、いきなり両方同時学習する事に。
色々同時にやるとトラブルのもとですが、まぁ今回は必要なのでそうしましょう。