の前に、昨日書き忘れてた免疫アルゴリズム(IA)について。 基本となる学習ルーチンは完成して、多腕バンディット問題を解ける所までは行きました。 という訳で今週末。 強化学習+IAでの将棋の評価関数パラメータの学習を実装する。 USI対応する。 いい加減…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。