2008-06-26 色々作りなおしたい 開発日記 TODO 強化学習エージェント 方策をエージェントから独立させる メタ強化学習対応 報酬の扱いを修正 探索ルーチン 静止探索専用で、静止探索でもハッシュ表を使用する 今はKFEnd流の2段階だけど、1段階で深さ無制限にするかも → 性能差を計測してから ハッシュ表 色々な探索ルーチンから使用可能にする 小宮さんとこで紹介されていたハッシュに興味あるし、ひょっとしたら使うかも df-pnを実装する事も考慮してハッシュを作る