ソフトマックス方策を実装 - GA将？開発日記～王理のその先へ～

　以前作ったクラスを使ってゴチャゴチャと処理するだけなんで、割とスムーズに出来ました。

　んで、4x4のリバーシでの学習に成功したんで、以下自分用のメモ。

　以上、メモ終わり。

　とりあえず後は適格度トレース（TD(λ)とかTDLeaf(λ)とかのλの処理）を実装すれば、将棋を実装する下準備は完了です。今月中には適格度トレースを動かせる状態まで持って行きたいですね。

*1:3回やって3回ともOKなだけだから、本当かは怪しいが。