GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2012-02-01から1ヶ月間の記事一覧

次回オープン戦は無理か・・・

今週末の12日ですが、とてもじゃないですが間に合いません。 という訳で、目標は4/14日のオープン戦。それまでには学習を完成させたいです。

ベイズ線形回帰を用いた評価関数をテスト中

前に書いた、技術評論社のサイトを参考にやってます。 現在、多次元の線形関数の近似をやってる所ですが、ノイズが少ない場合は収束速度・収束後の精度共に普通の線型近似より良い感じです。 ただ、ノイズの分散を増やすと一気に性能悪化するんで、どっかお…

学習と統計の境界線

Selene日記さんのエントリに反応してみます。 境界線っつーモノがあるのかどうなのか知りませんが、私の場合処理の途中に「能動的な何か」が入ると学習っぽいなー、と感じます。 例えばボナンザメソッドだと探索がありますし、自己対戦での学習だと探索・評…

2013年までのAMDロードマップ @ PC Watch

http://pc.watch.impress.co.jp/docs/column/kaigai/20120203_509658.html 来年後半に出るっていう、PiledriverコアのAbu Dahbi(Opteron後継で最大16コア)とかVishera(FX後継で最大8コア)あたりに期待。 PiledriverコアではIPC・クロックが向上するって…

先は長いなぁ…

行列クラスをポチポチと入力中。 今日はあんまり時間取れなかったから、ほとんど進展無し。 …週末にガッとまとめてやろう。うん。

オンライン将棋サイト 将星

http://shoseinet.com/ という最近できた(現在はオープンβテスト中)サイトがあるので、ちょっと宣伝してみます。 何で宣伝かというと私が作った訳では無くて、拙作のJavaShogiLibを使ってもらってるからです。ちょっと前に「JavaShogiLibを商用利用したい…

とりあえず自然方策勾配法を実装してみよう

昨夜から評価項目を絞って、パラメータ数を1000ちょっとにしたバージョンを方策勾配法(REINFORCE)で学習させてます。 これくらいのパラメータ数ならパラメータ数×パラメータ数の逆行列も普通に計算出来るので、評価関数をこのままで自然方策勾配法で学習させ…