2014-10-23から1日間の記事一覧
現在、Softmax実現確率探索を実装中です。 これがどういう物かと言うと、方策勾配法で局面遷移確率計算用関数のパラメータを学習するアルゴリズムです。探索自体は、激指の実現確率探索とほぼ同等。 んで、遷移確率計算には着手の表面的な性質(移動前後のマ…
http://d.hatena.ne.jp/Gasyou/20141022/1413978098 バグとしては1つで、エラーとして現れる現象が2種類あったみたいです。 で、原因は配列の領域オーバーによる他の変数の破壊でした。 とりあえず対策して、現在動作テスト中。一晩走らせてエラーにならなか…