ぐわ、gps500に切れ負けしてる

floodgate

http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2Ftools%2FLATEST%2F%2F2010%2F03%2F31%2Fwdoor%2Bfloodgate-900-0%2BGasyou_Atom-D510_1c2t%2Bgps500%2B20100331213006.csa 持ち駒たくさん…

2010-03-31

ガウス正則化は良い感じ、かも

開発日記学習経過

正則化係数1e-005のバージョンが、Lesserkai相手に19勝1敗。sspとは勝ったり負けたりで、多分ほぼ互角かちょっと弱い位。ただ、ところどころ学習不足感があるので、このパラメータで学習用マシンを使って引き続き走らせてみます。

2010-03-31

そんなこんなで、奥の手

開発日記

学習を成功させる…のは現状では厳しそうなので、他のところで何とかします。んで、floodgateのRを見る限り、マシンパワーってのはやっぱり大切みたいです。そういう訳で、並列化とPonderを実装して、マシンはCore i7 940を投入するかも、です。 Core 2 Duo…

2010-03-31

かってに一次予選予想

コンピュータ将棋

まずおさらいしとくと、一次予選通過数は現状8チームの予定。ただし、明日以降に2次シードチームが棄権すると通過数が増えますので、その辺は流動的。んで、参加チームリスト。以降、敬称は略させて貰います。 http://www.computer-shogi.org/wcsc20/team.h…

2010-03-31

8コアXeon発表

コンピュータ関連

http://pc.watch.impress.co.jp/docs/news/20100331_357926.html 例によって大須では絶対買えないでしょうが、とりあえずリンクだけ。 1ソケットで8コア16スレッドですよ、クロック低いとはいえ、これは楽しそうです。

2010-03-30

ガウス正則化を実装

開発日記

L1正則化とかペナルティとかって呼ばれてるものと同じ？その辺はよく分かんないですが、とりあえずざくっと実装。んで、正則化係数のベストな設定が分からないんで、学習用マシンと開発用マシンで2パターン並行して走らせてみます。 …最近、いきあたりばっ…

2010-03-30

12コアOpteronが秋葉原で発売に

コンピュータ関連

http://akiba-pc.watch.impress.co.jp/hotline/20100403/etc_amd.html マザーは未登場でCPUだけなんですが、6コアXeonより高性能って話もあるので、ひょっとしたら（秋葉原で手に入る）現状最速のCPUかもしれません。んで、どうでもいい話ですが、ニコイチ…

2010-03-29

色々迷走中

開発日記

昨日は旧バージョンを引っ張り出してそっちで全幅2手で学習させてみたいんですが、それでもどうも弱くなってる気がします*1。んで、全幅1手でざっと学習→パラメータ引き継いで全幅2手で学習って流れに問題があるのかと考えて、今度は最初っから全幅2手でや…

2010-03-27

なんか、全幅2手で学習すると弱くなってる

開発日記

全幅1手のパラメータを引き継いで学習させてるんですが、日を追うごとに弱くなってる気がします。なんかバグの予感がするんで、ちょっと調べてみます。

2010-03-27

アピール文章提出完了

コンピュータ将棋

結局パワポで書いてPDFに変換しました。やっぱパワポは楽だわ。

2010-03-26

ヤバイ、アピール文章読むのが楽しすぎる

コンピュータ将棋

http://www.computer-shogi.org/wcsc20/team.html 特に初参加チームで、みんな色々考えてて面白いです。あ、芝浦名人将棋はTD(λ)を使った強化学習だそうです。パラメータ固定Bonanza対学習ありBonanzaで対局・学習して、勝率6割まで向上したそうです。あと…

2010-03-23

そろそろやる事を絞る時期かも

開発日記

まず、現在3つの方式での学習を実装しました。対Bonanza戦でのTDLeaf(λ) 自己対戦でのTDLeaf(λ) 自己対戦でのSelf-Play Bonanza Method んで、今の所2.が一番ましな強さになってるので、選手権まではそれに集中する事にします。1.にもまだ伸びる可能性は感…

2010-03-23

昨日書き忘れたいくつかの事

開発日記

対Bonanza戦での学習ですが、グラフを再掲。（クリックで原寸大表示します）赤と黄色の系列がそれぞれ先手・後手でのGA将!!!!の勝率なんですが、片方が高い時はもう片方が低い傾向にあります。これが何を意味しているかというと…何なんでしょうね？評価…

2010-03-22

Phenom X6は意外と安いのかも？

コンピュータ関連

http://nueda.main.jp/blog/archives/004921.html と言う噂があります。最上位の1090Tが＄295だとすると、日本円で2万円代後半になるんでしょうかいくらなんでも安すぎる気がしますが、本当にこの価格なら私も一つ欲しいですね。

2010-03-22

対Bonanzaでの学習の途中経過

開発日記

対局条件ですが、GA将!!!!は通常の評価項目＋探索は全幅2手*1・静止探索4手。Bonanzaは定跡ありで探索深さ3に制限、Resignは3000。Bonanzaの深さは、BonanzaとGA将!!!!で思考時間がほぼ同じになる様に決めました。（クリックで原寸大表示します）上のグラ…

2010-03-22

土日にやった事

開発日記 floodgate

定跡を超適当＆行き当たりばったりに実装してみた → すぐ定跡外れて役に立たねぇ orz 対Bonanzaでの学習で、初回の学習が終わった（後述）定跡実装バージョンでfloodgateに参戦（今日の18:30の回から）。パラメータは以前のサルベージバージョン。

2010-03-20

そろそろアピール文書の提出しなきゃならないんですが

コンピュータ将棋

いまだに学習の方式すら固まってないという状況。どうしましょうね…

2010-03-20

現実逃避気味に定跡の実装中

開発日記

ちゃんと学習出来れば不要なんですが、現状ではどうも怪しいので先回りして実装。 …なんか最近、激しくいきあたりばったりな希ガス。

2010-03-19

Self-Play Bonanza Method実装中

開発日記

ちょっと前に書いた自己対戦でのボナメソですが、名前が無いと不便なので「Self-Play Bonanza Method」と名付けました。んで、基本的に今までのコードの継ぎ接ぎ増改築で何とかなったんで、サクっと実装してじっくりテスト中。

2010-03-19

C2D-P8600参戦終了

開発日記 floodgate

Rは1500後半で落ち着いたんで、多分これ位が本当のRなんでしょう。となると、Atom-D510とのR差は200ちょいで、これがマシンスペックの差の分ですね。意外とあります。

2010-03-17

色々細々と修正中

開発日記

今日やった事。 Bonanza相手の学習を開始。OK出してくれた保木さんに感謝！上で書いた、二駒相対の特徴量を修正。ちょっとだけネチッこくアサーション追加。千日手の評価値の扱いが変だったのを修正。んで、学習用マシンと開発用マシンで、Bonanza相手の…

2010-03-17

Gulftown/Westmere-EP正式発表

コンピュータ関連

http://journal.mycom.co.jp/news/2010/03/17/050/index.html http://journal.mycom.co.jp/news/2010/03/17/062/index.html デスクトップ向けはCore i7 980X Extreme Editionで、サーバ向けがXeon 5600番台。選手権までに出る普通のCPUだとこの辺が最上位で…

2010-03-17

選手権までにやってみたい事

TODO

二駒相対評価の特徴量を少しいじる（遠い駒同士の関係ほど特徴量小さく）自己対戦の結果からのボナンザメソッド定跡を実装一つ目は、二駒相対評価の特徴量を1/距離にすると言うもの。遠い駒同士の関係はあんまり重視しなくていいはずなので、それを反映し…

2010-03-13

選手権用のノートPCで参戦

開発日記 floodgate

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou4_C2D-P8600_2c%2B32b72b907b9de039016540368bce458d 今日メモリを4GBに増設したんで、テストも兼ねて参戦中。しばらくしたら引…