GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

報酬の計算式をいじる

 一晩学習させたんですが、入玉率が低いままなので失敗でした。

 で、昨日書いた報酬の設定から、更に終局時に敵陣にいる駒・持ち駒の数に応じてボーナスを加算する様にしてみました。

 「入玉出来なかったけど惜しかったね」と教えてやれば、次からはもっと入玉狙いにならないかとの思惑です。

 んで、パラメータが2個あるんで、シングルスレッド学習を8種類のパラメータで並行して走らせてみます。とりあえず一晩学習させて、様子見ですね。