2010-09-16から1日間の記事一覧
まずは三目モードでコンパイル出来る様にしないと。最近は将棋の拡張ばっかしてたんで、多分コンパイルエラーが多発するはず。
どっかおかしかったら指摘お願いします。 まず、行動価値関数Qは下記の通りの線形近似を行う。 ここで、Bは特徴量の数(次元数)、は特徴量。 次に、方策は下記の通り。 次に、は下記の通り計算出来る。// 17:54修正 こうですか分かりません // 21:09追記 間…
まずは三目モードでコンパイル出来る様にしないと。最近は将棋の拡張ばっかしてたんで、多分コンパイルエラーが多発するはず。
どっかおかしかったら指摘お願いします。 まず、行動価値関数Qは下記の通りの線形近似を行う。 ここで、Bは特徴量の数(次元数)、は特徴量。 次に、方策は下記の通り。 次に、は下記の通り計算出来る。// 17:54修正 こうですか分かりません // 21:09追記 間…