2011-07-30 とりあえず現状やりたい事のまとめ TODO シグモイド関数無しでの方策勾配法 レポート収集系の整理 パラメータのセーブ・ロードまわりのテスト 方策勾配法の提案論文を探す&読む ソフトマックス方策の改善 http://ibisml.org/ibis2008/abst-poster.htm#A04 http://ci.nii.ac.jp/naid/110008004285 ベイジアン方策勾配法の調査 "平均報酬の多様体に基づく方策勾配法"の調査 http://ci.nii.ac.jp/naid/110006549439 NumericVectorクラスの高速化 合議にリトライ LMRのパラメータを乱数で初期化して合議 合議の票数を基準とした思考時間制御 ニューロで局面情報の圧縮&評価項目として使用 http://www.eb.waseda.ac.jp/murata/ryotaro.nishino/openhouse/result.php Ponderもどき(相手の手番に現局面から学習する) Historyの特徴に王手・非王手を入れてみる