GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2018-11-05から1日間の記事一覧

PGLeaf Drei Phase 2ほぼ完成か?

現在開発中の学習ルーチンは「PGLeaf Drei」と呼んでいますが、Phase 2まで(多分)完成しました。 まず、Phase 1でREINFORCEベースだったものから、関数近似を用いたActor-Critic化を行いました。 で、Phase 2ではExperience Replayの導入をしたのですが、…