2018-11-05から1日間の記事一覧

2018-11-05

PGLeaf Drei Phase 2ほぼ完成か？

開発日記

現在開発中の学習ルーチンは「PGLeaf Drei」と呼んでいますが、Phase 2まで（多分）完成しました。まず、Phase 1でREINFORCEベースだったものから、関数近似を用いたActor-Critic化を行いました。で、Phase 2ではExperience Replayの導入をしたのですが、…

GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

2018-11-05から1日間の記事一覧

PGLeaf Drei Phase 2ほぼ完成か？