2008-06-05から1日間の記事一覧
とりあえずTDLeaf(λ)+線形評価関数が上手く行かないので、それの対応策。 教師ありで学習してみる(評価関数・探索ルーチンは流用) TDLeaf(λ)のエージェント以外がちゃんと動作しているかの確認 + 情報収集が目的 いきなりニューロで評価関数を実装してみ…
とりあえずTDLeaf(λ)+線形評価関数が上手く行かないので、それの対応策。 教師ありで学習してみる(評価関数・探索ルーチンは流用) TDLeaf(λ)のエージェント以外がちゃんと動作しているかの確認 + 情報収集が目的 いきなりニューロで評価関数を実装してみ…