2010-09-15から1日間の記事一覧
連続状態・行動の部分とかソースコードとかは一部読み飛ばしましたが、大体読了。 …ダメだ、さっぱり理解出来てない。もう一度、手計算しながら読む必要がありますね。 それから、需要があるかどうかは不明ですが、読んだ感想。 まず、強化学習を一から理解…
「方策勾配法だと実用上の問題が多いので、自然方策勾配法を使う必要がある」って理解でいいのかな? いや、各アルゴリズムの詳細が全く理解出来てないんで、全然良くないんですが(汗 …まずは方策勾配法を実装して、その後自然方策勾配法に移ろう。一気に色…
頭爆発しそう。 誰だよ、微分とか考えた奴。俺には理解出来ないけど便利そうじゃねーか。
強くなるロボティック・ゲームプレイヤーの作り方 ~実践で学ぶ強化学習~作者: 八谷大岳,杉山将出版社/メーカー: 毎日コミュニケーションズ発売日: 2008/08/28メディア: 単行本(ソフトカバー) クリック: 73回この商品を含むブログ (12件) を見る 復習がてら…