GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

バグっぽいなぁ・・・

20:22:21 @ lib::reporting::ReportCollector::printReport() > GpD : 24642
20:22:21 @ lib::reporting::ReportCollector::printReport() > 先手の勝率 : 0.5
20:22:21 @ lib::reporting::ReportCollector::printReport() > 引き分け率 : 0
20:22:21 @ lib::reporting::ReportCollector::printReport() > 平均手数 : 88.9
20:22:21 @ lib::reporting::ReportCollector::printReport() > 終局二手前の評価値 : 6.277486
20:22:21 @ lib::reporting::ReportCollector::printReport() > 終局時の評価値 : 8.674604
20:22:21 @ lib::reporting::ReportCollector::printReport() > 探査率 : 0.0557426
20:22:21 @ lib::reporting::ReportCollector::printReport() > 温度 : 0.061489
20:22:21 @ lib::reporting::ReportCollector::printReport() > ウィンドウマージン : 0.849501
20:22:21 @ lib::reporting::ReportCollector::printReport() > 平均パラメータ修正量(序盤) : 5.42781e-005
20:22:21 @ lib::reporting::ReportCollector::printReport() > 平均パラメータ修正量(終盤) : 5.42781e-005
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_歩(中盤) : 25.643366
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_香(中盤) : 22.807716
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_桂(中盤) : 34.461331
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_銀(中盤) : 70.890720
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_金(中盤) : 90.874800
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_角(中盤) : 88.578551
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_飛(中盤) : 79.719960
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_と(中盤) : 103.340392
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_杏(中盤) : 94.663506
20:22:21 @ lib::reporting::ReportCollector::printReport() > 駒価値_圭(中盤) : 95.503422
20:22:22 @ lib::reporting::ReportCollector::printReport() > 駒価値_全(中盤) : 92.094114
20:22:22 @ lib::reporting::ReportCollector::printReport() > 駒価値_馬(中盤) : 104.157612
20:22:22 @ lib::reporting::ReportCollector::printReport() > 駒価値_龍(中盤) : 93.394097
20:22:22 @ lib::reporting::ReportCollector::printReport() > 進行度の平均二乗誤差 : 0.0833587
20:22:22 @ core::evl::LinearEvaluator3::outputToFile() > ファイルにセーブ中... "params.txt" & "params_2011_12_08.txt" 完了。

 終局時の評価値が8前後なのに温度が0.06前後で、評価値の絶対値と温度の差が大きい気がします。

 TDLeaf(λ)だとこうならなくて、評価値と温度がもうちょっと近い感じでした。

 多分、今やってる方策勾配法だと最善手と次善手の評価値の差が小さいので、その影響で温度が低くなっている*1んじゃないかとは思うんですが。

 一度、最善手と他の手の評価値の関係をグラフにしてみた方が良さそうですね。まずはどういう現象が起きてるのか把握しないといけないので。

*1:最善手以外の手を選ぶ確率が0.05になる様に、自動で温度調整している為