開始点探査は失敗だった模様
駒割も位置評価もパラメータ見てみると変だし、対局させても全然強くないです。
ただ、初期位置の位置評価が高すぎるって問題は解決してたんで、方向性としては間違ってない…のかな?
という訳で、今度は対局開始から50手はランダム指しにして学習させてます。
これならランダム指し終了後の駒の位置はある程度バラけつつ、それなりに「在り得る」形から学習開始出来ないかと。
学習中の駒割のパラメータ見てみると角・馬の価値が低めですが、収束するまでにはちゃんとなるかもしれません。
駒割も位置評価もパラメータ見てみると変だし、対局させても全然強くないです。
ただ、初期位置の位置評価が高すぎるって問題は解決してたんで、方向性としては間違ってない…のかな?
という訳で、今度は対局開始から50手はランダム指しにして学習させてます。
これならランダム指し終了後の駒の位置はある程度バラけつつ、それなりに「在り得る」形から学習開始出来ないかと。
学習中の駒割のパラメータ見てみると角・馬の価値が低めですが、収束するまでにはちゃんとなるかもしれません。