GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

TD(λ)＋メタ強化学習は一応完成

開発日記

　と言うか、完成した事にします。

　んで、実験結果はまぁまぁ良かったのですが、メタパラメータ手打ちの方が良い結果だったので、当面は手打ちで行く事にします。

　さて、後はリバーシにTD(λ)を組み込んだら予備実験は完了。ようやくコンピュータ将棋で強化学習に入れます。

　あ、その前にQ(λ)にしないといけないのか。まぁ、これはすぐ出来るでしょう。