GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

合議+方策勾配法続き

 どうもどっかでメモリリークしてるっぽくて、学習させてたのはメモリ不足エラーで落ちてました。

 それと、合議サーバの方策πの中に合議クライアントの方策π'がある状態なんで、πの勾配が計算出来るはずです*1

 つー訳でまた微分と格闘してるんですが…ムズいです。正直、いつになったら終わるのかさっぱり見当も付きません。

 まぁでも、これは超えなきゃならない壁だから、何とかしないと。

*1:現状のコードは、クライアントの勾配しか計算していない手抜きバージョンです