GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

少しだけマシに

 メタパラメータを思い切って2桁ほど下げてみたら、そこそこ学習してくれる様になりました。つってもまだパラメータ手打ちより悪いんですけど。

 ただ、数分間動かしてみてまだ学習が進みそうなんで、一晩動かしてみる事にします。4プロセス並行で。

 ん〜、でもやっぱメタパラメータを手打ちってのはちょっと都合が悪いなぁ。メタパラメータ調整用にメタメタエージェントを作っても今度はメタメタパラメータが手打ちになるし。

 となると、メタエージェントが自分自身のメタメタパラメータも調整する形にするのが一番良い? メタ強化学習が上手くいったら、今度はそれにトライですね。