GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

ツツカナ流探索ルーチンの学習法

 アピール文書には「学習は式(2)を勾配法等で最小化する」とサクッと書かれていますが、私の頭では微分がすぐには出来なかったのでメモ。

 まずC\left(P\right)微分

\nabla_{w_i}C\left(P\right)=\sum_{p \in P}\nabla_{w_i}C\left(p\right)

 んで、C\left(p\right)微分

\nabla_{w_i}C\left(p\right)=\sum_j\left{\nabla_{w_i}B_p^{D\left(p,t_p\right)-D\left(p,m_{pj}\right)}\right}

 B微分は指数部をuとして

\nabla_{w_i}B_p^u=B^u \cdot \log_e B \cdot \nabla_{w_i}u

 今度はu偏微分

\nabla_{w_i}u=\nabla_{w_i}\left{D\left(p,t_p\right)\right} - \nabla_{w_i}\left{D\left(p,m_{pj}\right)\right}

 Dシグモイド関数の合成関数なので

\nabla_{w_i}D\left(p,m\right)=s \cdot f_i\left(p,m\right) \cdot \frac{D\left(p,m\right)}{s} \cdot \left(1-\frac{D\left(p,m\right)}{s}\right)

 かなり自信無いけど、とりあえず以上で完了!