の前に、昨日書き忘れてた免疫アルゴリズム(IA)について。
基本となる学習ルーチンは完成して、多腕バンディット問題を解ける所までは行きました。
という訳で今週末。
- 強化学習+IAでの将棋の評価関数パラメータの学習を実装する。
- USI対応する。
- いい加減GPW2012の論文を公開する。
- 秘密の資料作成。
ただ、強化学習+IAはメモリが足りるか心配。個体数を64とか128とかにしたいけど、そうすると色々とメモリ上に確保しなきゃいけないデータが増えますので。
まぁ、最悪学習条件を変えて回避するとかって手もあるし、まずは実装してみてからですね。