GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-11-19から1日間の記事一覧

細々と修正中

対局終了時の情報表示回りで足りない機能があったので、その辺を追加…してたら、学習結果がなんか変でした。 んで、よくよく調べてみると、アルゴリズムがTDLeaf(λ)じゃなくてTD-directed(λ)*1になってました。 …えーっと、これって大分前に変更した箇所だか…

プラン再構築

メタ強化学習関連をざっくり削除。「ニューロ評価関数+メタ強化学習で、動的にノードの追加・削除を行う」ってプランがあったのですが、それに関しても後で検討する事にします。 それから、リバーシ用の線形評価関数はイマイチ能力的に怪しい部分があるので…