GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2010-11-09から1日間の記事一覧

今後の方針について検討中

方策勾配法でパラメータ数が多い場合に学習出来ないとすると、それじゃぁその次はどうするんだって話です。 んで、今はざっと二つ案があります。 頑張って方策勾配法で何とかする。 TDLeaf(λ)やTreeStrap(αβ)に戻る。 出来れば前者で何かしたいけど、現状で…

印刷してみたら、評価関数だけで55ページあった件

長すぎ&重すぎ。 ファイルサイズ見たら112KBだった。無駄に色々書いてるなぁ。

設定変えて学習用マシンに投入

相変わらず方策勾配法で学習出来ないかやってます。 んで、まだ5五将棋でsspにもTDLeaf(λ)バージョンにも追いつけてないので、思い切って設定変えたのを投入。 評価項目を駒割+筋・段個別の絶対位置評価+王将の移動可能範囲(距離3まで)に変更。 パラメー…