2008-05-19から1日間の記事一覧
バグは発見出来ず。 後手のε(ランダムに行動する確率)を1.0、先手は0.01で学習させてみましたが、2局目以降は先手が勝ち続けました。 よって、強化学習部分はちゃんと動いている(多分)。 評価関数も問題無し(多分)。 αβで探索するのもOK(多分)。 となる…
昨日の修正ですが、パラメータがどうも変です。 歩や金に自分の利きがあると大きくマイナス評価になっていたり、相手の利きが無い方がある時より評価が低かったりします。 どうもバグッてる可能性が高いですね。一度ソースを見直してみます。
http://www.computer-shogi.org/blog/wordpress%e3%82%92251%e3%81%ab%e3%82%a2%e3%83%83%e3%83%97%e3%83%87%e3%83%bc%e3%83%88%e3%81%97%e3%81%be%e3%81%97%e3%81%9f/ 私の環境の方の問題かもしれませんが、チョイと不具合があったので書きます。(本当は先…
http://home.q00.itscom.net/otsuki/jisenkiCSA2008-2.htm 進行度ありの評価関数でのBonanzaメソッドでの学習に成功されたみたいですね。 序盤用と終盤用のパラメータを持っていて、中盤では進行度に応じて滑らかにつなぐ感じみたいですから、評価値をパラメ…