GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-09-02から1日間の記事一覧

今日までの実装項目を反映

「Q学習の拡張」というのは、上で書いた「非グリーディー行動時には価値関数のバックアップをしない」というものです。 適格度トレースを実装した時点で、非グリーディー行動時の価値関数の目標は、単に先読みして得た評価値に過ぎなくなる*1ので、それを目…

今日は外で遊んでたので少なめ

Q学習では、実際の対局でどの手を指したかとは無関係に*1、「仮にグリーディーな行動*2を取っていたら、その後の局面の評価値がどうなっていたか」を予測して評価関数のバックアップ*3を行います。 しかし、「TD法+関数近似では上手く動くけど、Q学習+関数…

機動戦士ガンダム 0083 カードビルダー

映画館の下の階にゲーセンがあって、映画を観ると駐車場6時間無料なのでやってきました。店側の策略にのせられてるなぁw んで、ヤヴァイっすね、このゲーム。 一回遊ぶとカードが1枚出てきて、それで自分のユニットを強化したり出来るんですが、良いカードが…

ヱヴァンゲリオン新劇場版:序 (ネタバレ注意)

映画の日から遅れること一日、観てきました。ネタバレあるので“続きを見る”で。