2012-04-10 報酬の計算式をいじる 開発日記 一晩学習させたんですが、入玉率が低いままなので失敗でした。 で、昨日書いた報酬の設定から、更に終局時に敵陣にいる駒・持ち駒の数に応じてボーナスを加算する様にしてみました。 「入玉出来なかったけど惜しかったね」と教えてやれば、次からはもっと入玉狙いにならないかとの思惑です。 んで、パラメータが2個あるんで、シングルスレッド学習を8種類のパラメータで並行して走らせてみます。とりあえず一晩学習させて、様子見ですね。