2010-09-23から1日間の記事一覧
方策勾配法自体は三目並べと同じ奴を使い回して、主に評価関数まわりの機能追加。 ざっとテストして大丈夫そうなので、学習用マシンはリリースモードで、開発用マシンはアサーション有効で走らせてみます。
http://pc.watch.impress.co.jp/docs/news/20100922_395572.html 30インチで10bitカラー対応、15万円代。 今も30インチのを使ってるんですが、入力が1系統でHDCP非対応のせいで、地デジもBlu-rayも見れないんですよ。 …よし、貯金してでも買おう。
まだ収束が遅くて10万局前後かかってますが、ちゃんと引き分けに収束しました。 収束は多分TD(λ)より遅いですが*1、問題は収束速度より伸び代なんで、そっち方面で期待しています。あと、関数近似を入れると収束速くなるかもしれませんし*2。 さてと、それじ…
http://journal.mycom.co.jp/articles/2010/09/22/hot_chips22_greendroid/index.html 詳細はちゃんと理解出来てないんですが、どうもソースコードを分析して、その部分を処理する専用ハードを自動生成してくれるらしいです。 Reconfigurableプロセッサ*1と…
先手だけ学習し、後手が左上から順に打っていくという条件下で、勝率が99〜100%に収束しました。とりあえずは成功ですね。(後手がランダム指しだと、勝率80%位が上限でした。) んで、次は後手だけ学習させて、それが上手く行ったら将棋の方も実装ですね。
方策の実装間違ってましたよ orz そりゃ学習してくれないはずだ。納得。
http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2Ftools%2FLATEST%2F%2F2010%2F09%2F23%2Fwdoor%2Bfloodgate-900-0%2BGasyou_Atom-D510_1c2t%2Bgps_normal%2B20100923143003.csa 何があった…