GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-03-23から1日間の記事一覧

進行度を利用した評価関数のパラメータ学習に関する、新しいアイデア

芝浦将棋Jr.の五十嵐先生と相談中で、ひょっとしたら論文ネタになるかもしれないので、ザクっと書いてみます。 まず、自己対戦の結果から強化学習(TDLeaf(λ)やPGLeaf)で学習する際に一番問題になるのは、序盤〜中盤の学習が上手く行かない事です。 これは…