GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

成果無し

バグは発見出来ず。

後手のε(ランダムに行動する確率)を1.0、先手は0.01で学習させてみましたが、2局目以降は先手が勝ち続けました。

よって、強化学習部分はちゃんと動いている(多分)。

評価関数も問題無し(多分)。

αβで探索するのもOK(多分)。

となると後は…学習が遅いだけ?

とりあえずパラメータを引き継いでもう一晩学習にトライしてみます。