GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

進行度計算を自前のルーチンで学習

 学習ルーチンが完成したんで、学習率・学習セット数と平均二乗誤差の関係をグラフにしてみました。

 使用した棋譜将棋倶楽部24棋譜で、学習用・誤差検証用に各100局分です。100局分の棋譜からパラメータ修正するのを1セットとして、それを1万セット繰り返しました。

 

 この結果を見ると、学習率0.001が一番良さそうなんで、この値を使う事にします。


 んで、学習用棋譜を1000局分に増やしてみました。

 結果、1000棋譜×10セット学習で平均二乗誤差0.00984978、1000棋譜×1セットだと0.0105389。

 これくらいの誤差の差なら、1セットでも十分かも。


 今は24の棋譜から学習していますが、後で自己対戦の棋譜からの学習に変更する予定。

 流れとしては、強化学習で評価関数のパラメータ修正しつつ、棋譜を保存。棋譜が1000局分集まったら進行度計算ルーチンで1セット学習って感じで。

 2つのクラスで同時に学習するのは初めてなんで、何か問題が出るかもしれませんが、それはその都度対処する方向で。