2007-08-29から1日間の記事一覧
ざっくりテストしてみましたが、多分正しいはず。ただ、まだ強化学習エージェントには組み込んでないので、本格的に動き出すのは明日から。 他に、リバーシの局面クラスと強化学習のタスクを結ぶ部分を実装。テーブル形式*1の行動価値関数を使うバージョンは…
ざっくりテストしてみましたが、多分正しいはず。ただ、まだ強化学習エージェントには組み込んでないので、本格的に動き出すのは明日から。 他に、リバーシの局面クラスと強化学習のタスクを結ぶ部分を実装。テーブル形式*1の行動価値関数を使うバージョンは…