GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

と、いう訳で

開発日記

　新アルゴリズム *1のノイズ付加探査を実装＆軽く動作確認も兼ねてテスト。

　んで、結果です ↓（クリックで拡大）
　

　4x4リバーシで、探索深さ3手で学習した評価関数と、完全読みプレイヤーを対局させた結果です。

学習は各設定（分散系数）で乱数のシードを変えつつ10回行い、その平均値をグラフにしました。
各グラフの横軸はステップ数（100局で1ステップ）、縦軸は完全読みプレイヤー相手の対局結果（平均石差）。
青い線が先手＝学習結果の評価関数、後手＝完全読みプレイヤー。赤い線は先後逆。
実験は、ノイズ（正規乱数）の分散を色々変えて9通り行いました。グラフの右にある「先手 xxxx」のxxxxの部分が分散の係数。

　収束速度と収束後の挙動を見ると、分散系数0.003か0.001が良さげですね。収束速度・収束後の挙動共に優秀です。

　さて、それでは大体この辺りって範囲は絞り込めたので、一晩かけてもうちょっと細かい結果を出してみますか。

*1:と言っても、過去2回ほど失敗していますが…