2010-08-26から1日間の記事一覧
出したいけど、ネタが無い orz TreeStrap(αβ)で学習するやつでも作って出してみるか? でも、自己対戦でのTreeStrap(αβ)すら成功してないってのに、いきなりfloodgateでやってもダメだよなぁ… うーん、やっぱりTDLeaf(λ)でちゃんとしたのが出来るのを待つか?
k-確実探査法 : 強化学習における環境同定のための行動選択戦略という論文が面白そうだったので、購入して読んでみました。 んで、オーソドックスなQ-learningより優秀という結果だったんですが、コンピュータ将棋に応用するには一つ大きな問題が。 行動の種…
まずは自己対戦での学習に集中するとして、その辺の環境整備とか。 自己対戦時に探索を深くするとなぜか弱くなる件の調査 全自動で他のエンジンと連続対戦して強さを計測する環境の整備 自己対戦での学習を成功させる ABC探索 相手番に対局中の局面から自己…
ボナンザのソースコードが公開されたことで、かなりの人数の開発者は、コンピュータ将棋の開発に興味を失ってしまったのではなかろうか。私も、その一人になりそうだ。 ポンコツ車を如何に改造しても、現実的には、とてもスポーツカーには、かなわない。いっ…
まぁ、ゆっくりやりますか。