Javaで作ったエージェント*1はTD法→Q学習→TD(λ)→Q(λ)と色々アルゴリズムを変えながら拡張していったので、かなりグチャグチャになっていました。 が、今回C++に移植するにあたって*2ちゃんと整頓したら割と綺麗になりました。 まぁ、綺麗なのは最初だけで、…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。