2008-10-26から1日間の記事一覧

色々修正

TODO

開発の方はさっぱり進まないです。この分だと、年内に完成も難しいかも… リバーシでの予備実験 TDLeaf(λ)実装。メタ強化学習で、状態を見て行動選択する様に変更。メタ強化学習で、状態の表現方法を検討。 εグリーディーとソフトマックス手法の比較。 TDLe…

開発日記

10/20の開発日記に書いた値でOKでした。