とりあえず行列クラスを作る

開発日記

3万×3万要素の逆行列を計算する速度が気になったんで、まずは行列クラスから作ってます。んで、ここを参考に実装してみたんですが…遅いです。 Core i7 940上で動かして、1000×1000の逆行列を求めるのすら3秒かかってます。1万×1万とか3万×3万は動かしてはみ…

2012-01-29

光さす庭で Zwei

開発日記

えーっと、パラメータ数をカウントするコードを調べてみたら、デッドスペースの大半を除いて33,513個でした。実際には後ちょっとデッドスペースがあるんで数％は減るでしょうが、3万前後ってのが最終的な個数になりそうです。そうすると、パラメータ数×パラ…

2012-01-29

光さす庭で

開発日記

丁度一年ほど前に自然方策勾配法、無理かもという記事を書きましたが、改めてパラメータ数を数えてみると行けそう。現状の評価項目で進行度無しだと、パラメータ保存用に確保している領域が33,513個。ただ、この内2/3〜3/4は使ってないデッドスペースなんで…

2012-01-28

AMD FX-4100のYSSベンチ

コンピュータ将棋

http://www32.ocn.ne.jp/~yss/bench.html YSSベンチの結果が気になったんで、久しぶりに結果を見てみました。 Core i7 2600Kが4.7秒、FX-4100が6.7秒なんで、FXシリーズのシングルスレッド性能はi7 2000シリーズの7割前後って感じでしょうか。どっちのCPUも…

2012-01-28

BulldozerなOpteron 6274のレビュー

コンピュータ関連

http://blog.livedoor.jp/amd646464/archives/52254667.html 16コア・2.2GHzのOpteron 6274と6コア・12スレッド・3.33GHzのXeon X5680（共にデュアルCPU構成）がCINEBENCHではほぼ互角の性能らしいです。 CINEBENCHはコア数・スレッド数がスコアに与える影響…

2012-01-28

ベイズ線形回帰での評価関数リトライ？

開発日記

http://gihyo.jp/dev/serial/01/machine-learning/0013 技術評論社のサイトでベイズ線形回帰の解説記事があったんで、これを参考にもう一度試してみようと思います。とりあえず簡単な関数の近似を実装してみて、上手く行きそうならTDLeaf(λ)と組み合わせて…

2012-01-22

学習率1E-7で10万局学習したパラメータ

開発日記学習経過

Lesserkaiに20連勝出来たんでsspと一晩対局。結果、33-3-151で勝率17.9％。弱いです。まぁ、まだ学習不足って可能性もあるんで、もうちょっと時間置いてから再度対局させてみます。

2012-01-18

学習率の調整中

開発日記

昨日の改良はほとんど意味ありませんでした＿|￣|○ んで、ログを見てると学習率が高すぎる可能性があるんで、一旦調整中。とりあえず、シングルスレッドでの学習を複数通りの学習率で一晩走らせてみます。

2012-01-17

飛び利きを遮る駒の評価を追加

開発日記

行き詰まってるんで気分転換がてら評価項目を追加。飛び利きを遮る駒の評価を入れてみました。とりあえずざっとテストして、問題無さそうなんでアサーション有りと無しとで2プロセス並行して走らせてみます。まぁでも、これで学習が改善する見込みはないだ…

2012-01-14

論文「変分ベイズ法による自然方策勾配の推定法」を読んだ感想

開発日記

さっぱり理解出来ませんでした＿|￣|○ ただ、縦横パラメータ数次元の行列が必要そうなので、多分GA将で使うのは無理です。多分。さーて、それじゃぁ次はどうしようかなっと。

2012-01-12

Sandy Bridge-EPは3月発表？

コンピュータ関連

http://blog.livedoor.jp/amd646464/archives/52250992.html 次世代Xeon DPとなるSandy Bridge-EPは3月のCeBITで発表されるらしいとの情報です。 8コア×2スレッド×2ソケットでシステム全体では32並列のマシンが組めますね。複数評価関数で合議をやるなら2の…

2012-01-12

電王戦第1局のPV

コンピュータ将棋

「人がロジックに支配される時代」ってのは言い過ぎでしょうが、それ以外は雰囲気出てて盛り上がる感じですね。『「看板を獲る」という事であれば全員倒してから言っていただきたい』という発言もありましたが、これも面白そうですね。現役プロ棋士全員VS選…

2012-01-12

昨夜からの連続対戦

開発日記学習経過

まずはLesserkaiに20連勝したパラメータで朝までsspと連続対局。結果、24-3-118で勝率16.9％。まだまだですね。それから、昨夜開始して今朝まで学習してたパラメータをLesserkaiと。こちらは341-3-79で勝率81.2％。95％信頼区間は77.1〜84.8。こっちはま…

2012-01-11

パラメータ変更して学習したバージョン

開発日記学習経過

変更したパラメータ等は下記の通り。学習率0.0001 正則化係数1E-7 サンプリング間隔100 その他細かい設定はTaskディレクトリのgasyou5_2012_01_03_23_49_57__pgtest.txt参照。んで、約100万局学習したパラメータでLesserkaiと20戦やらせてみたら、全勝しま…

2012-01-11

Atom Z2460搭載スマートフォン

コンピュータ関連

http://pc.watch.impress.co.jp/docs/news/event/20120111_503520.html http://pc.watch.impress.co.jp/docs/news/event/20120111_503508.html 海外ではLenovoとMotorolaが開発中らしいですが、国内ではどっか出さないでしょうかね。 Atomのスペックは1.6GHz…

2012-01-07

再現しねぇ…

開発日記

「初手から50手だけ学習すると囲う*1」現象ですが、いつの間にか再現しなくなってました。 …困った。過去のソース引っ張り出すしかないのかな？ *1:と言うか、王将の周りに駒をベタベタ集める

2012-01-03

VS Lesserkai

開発日記学習経過

対局条件は以前と同じでやってみました。対局数は基本20局。ただし、5連敗したらその時点で中断しています。んで、結果。正則化係数勝敗コメント 1.0E-3 0-0-5 駒割にも正則化が効いてる。論外。 1.0E-4 11-0-9 まだ駒割に正則化が利いている。 1.0E-5 …

2012-01-02

を、ちょっと改善したかも

開発日記学習経過

方策勾配法のサンプリング数*1を10局から100局に増やしたバージョンですが、それなりに囲う（というか、守ろうとしている）様子があります。 17:57:58 @ core::rl::GameAggregator::aggregate() > 80000局終了 17:57:58 @ core::rl::GameAggregator::aggrega…

2012-01-02

一日遅れで明けましておめでとうございます

雑記

今年もよろしくお願いします。さて、そういう訳で大須に初詣買初めに行って来ました。Grow Up Japan SMART DRIVE NEO 【日本製】 GUP-SMDNEO出版社/メーカー: GROW UP JAPANメディア: Personal Computers クリック: 1回この商品を含むブログを見る今年組む…

GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

2012-01-01から1ヶ月間の記事一覧

とりあえず行列クラスを作る

光さす庭で Zwei

光さす庭で

AMD FX-4100のYSSベンチ

BulldozerなOpteron 6274のレビュー

ベイズ線形回帰での評価関数リトライ？

学習率1E-7で10万局学習したパラメータ

学習率の調整中

飛び利きを遮る駒の評価を追加

論文「変分ベイズ法による自然方策勾配の推定法」を読んだ感想

Sandy Bridge-EPは3月発表？

電王戦第1局のPV

昨夜からの連続対戦

パラメータ変更して学習したバージョン

Atom Z2460搭載スマートフォン

再現しねぇ…

VS Lesserkai

を、ちょっと改善したかも

一日遅れで明けましておめでとうございます