GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

完全にミスったw

 昨年末から学習回していたPGLeaf DreiのRMSProp+慣性項バージョン、レーティング上昇が頭打ちになったと思って学習止めて*1、止めた時点のパラメータでsspとやらせたら勝率上昇してた。

 んで、慣性項はOFFにするのを忘れてただけなんで、OFFにして学習させたら全然強くならない。

 という訳で、も一回RMSProp+慣性項で学習回してます。

 …新年早々グダグダだなぁ。

*1:この時sspとスパーリングしてたのは1日前のパラメータ