2015-12-20から1日間の記事一覧
Windows上でCaffeを使ってsin関数を近似する所までは成功。 自前のテスト用ドライバとの結合も上手く行ったので、次はもうちょっと複雑な関数の近似をさせてみます。 んで、明日はDeepTDLeaf(λ)を実装して三目並べの学習を開始する予定。
まず最終的な学習ルーチンの構成は「TDLeaf(λ)+Softmax方策+DNN評価関数」とします。 時間があればPGLeafにしたいのですが、流石にそこまでは無理そうです。 んで、上記構成を実現する為にやるべき事。 DNN評価関数の実装。 Convolutionは使用せずに、全結…