2007-10-23 実験結果 開発日記 TD(λ)に適格度トレースを組み合わせて4x4リバーシで対戦させた結果ですが、λが大きいほど収束が速くなっていました。 結果のグラフは見ても面白く無さそうなので掲載せず。 とりあえず上手く動いている様なので、将棋の方にも組み込んでみます。