GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-08-04から1日間の記事一覧

Actor-Criticを用いた探索ルーチンの学習

強化学習にも色々あって、TD法の一種にActor-Critic手法というのがあります。 これは、通常のTD法(Sarsa)とは違い、方策*1と行動価値関数*2の独立性が高い手法です。 で、Actor-Criticと遺伝的プログラミングを合わせれば、探索ルーチンの学習が出来ないか…

¥42,000のX6800は売り切れらしい

ショボーン (´・ω・`)