GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2010-09-23から1日間の記事一覧

将棋用の学習ルーチンを実装完了

方策勾配法自体は三目並べと同じ奴を使い回して、主に評価関数まわりの機能追加。 ざっとテストして大丈夫そうなので、学習用マシンはリリースモードで、開発用マシンはアサーション有効で走らせてみます。

このディスプレイ欲しいなぁ

http://pc.watch.impress.co.jp/docs/news/20100922_395572.html 30インチで10bitカラー対応、15万円代。 今も30インチのを使ってるんですが、入力が1系統でHDCP非対応のせいで、地デジもBlu-rayも見れないんですよ。 …よし、貯金してでも買おう。

三目並べの方策勾配法、一応完成

まだ収束が遅くて10万局前後かかってますが、ちゃんと引き分けに収束しました。 収束は多分TD(λ)より遅いですが*1、問題は収束速度より伸び代なんで、そっち方面で期待しています。あと、関数近似を入れると収束速くなるかもしれませんし*2。 さてと、それじ…

ソースコードから自動的にハードウェアを生成するプロセッサ?

http://journal.mycom.co.jp/articles/2010/09/22/hot_chips22_greendroid/index.html 詳細はちゃんと理解出来てないんですが、どうもソースコードを分析して、その部分を処理する専用ハードを自動生成してくれるらしいです。 Reconfigurableプロセッサ*1と…

よっしゃ、一部成功

先手だけ学習し、後手が左上から順に打っていくという条件下で、勝率が99〜100%に収束しました。とりあえずは成功ですね。(後手がランダム指しだと、勝率80%位が上限でした。) んで、次は後手だけ学習させて、それが上手く行ったら将棋の方も実装ですね。

ウワァァァン 俺のバカ!

方策の実装間違ってましたよ orz そりゃ学習してくれないはずだ。納得。

あれ、gps_normalに勝っちゃってるよ

http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2Ftools%2FLATEST%2F%2F2010%2F09%2F23%2Fwdoor%2Bfloodgate-900-0%2BGasyou_Atom-D510_1c2t%2Bgps_normal%2B20100923143003.csa 何があった…