見るの忘れてましたが、一昨日〜昨日の実験結果
id:streakeagle:20071002:1191328581で書いた修正前後の、6x6リバーシでの対局の結果です。
まず、修正前。ずっと同じ石差(=同じ手順での対局)が続いている部分があります。グラフで言うと水平になっている部分です。
で、修正後。石差が割と上下していますが、平均すると後手10石勝ち位が中心になっています。
6x6リバーシの解明結果は後手4石勝ちらしいのでちょっと変ですが、おおむね上手く学習出来ていると思います。あとは評価関数の能力向上で何とかならないか、という感じ。
という訳で修正はそこそこ上手く動いていると判断して、昨日準備した適格度トレースの実装に移ります。