三目並べ・リバーシでの実験結果 - GA将？開発日記～王理のその先へ～

　学習条件は下記の通り。

　線形評価関数を使ったリバーシは評価関数の能力不足でちゃんと学習出来てない可能性があるとして、謎なのはテーブル形式を使ったリバーシ。両方学習は上手く行くくせに、片方のみだとNGって…

　ログを見てると平均石差とグリーディー方策に従った場合の石差の関係でちょっとおかしな事があるんで、その辺を調べてみます。

// 21:13追記

　図書館行ってる間にリバーシ・線形評価関数の両方学習を走らせたら、180万局前後で収束してました。

　うーん、となると、単に収束が遅いだけって可能性もある？他の設定も、もう一度試してみます。