GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2010-02-01から1ヶ月間の記事一覧

オーバーフィッティングのテスト完了

結論から言うと、T(x)としてシグモイド関数を使っていなかったのが上手く行かない原因だったみたいです。 んで、実装したらあっさりと1棋譜でのオーバーフィッティングは成功。あ、シグモイド関数の傾き(?)は100にしました。この値が大きいのか小さいのか…

棋譜一つで学習してオーバーフィッティングさせるテスト

…が、上手く行かない。棋譜の手の平均オーダリング順位が20前後までしか向上しない… なんだろう、評価関数の能力不足? それとも単に学習部分のバグ? うーん…

簡易ボナメソ実装中

PV末端の評価値を比較して、棋譜の手の方が他より評価値を高くするだけっていう超手抜き実装。もはやボナメソって呼んでいいのか不明。 とりあえず棋譜一つで学習して、棋譜の手の平均順位がちゃんと1に近くなっていく所までは確認済み。 ただ、ある程度強く…

ようやく出てきた次期Itanium Tukwila

http://pc.watch.impress.co.jp/docs/news/20100209_347904.html 4コア・8スレッドでTurbo Boost採用の他、QPI・DDR3メモコン統合など、次期Xeon MP(Nehalem EX)と共通の特徴もあります。 …個人的な感想は「まだ出てなかったのか」なんですが、それは言っ…

ISSCCレポート @ PC Watch

http://pc.watch.impress.co.jp/docs/news/event/20100209_347976.html 次期Xeon/Core i7になるWestmere 6Cの他、IBMのPOWER 7とSunのRainbow Falls等の情報があります。 POWER 7だと8コア・32スレッドで4GHz、L3は32MBですし、Rainbow Fallsは16コア・128ス…

どーも上手く行かない

ちょっと前から試しているTD法での棋譜からの学習ですが、どうにも上手く行ってないです。 チョコチョコとバグを潰して、多分ちゃんと想定した通りの動作をしているんですが、学習後のパラメータは弱いまま。 うーん、TD法で棋譜から学習するのは見切りをつ…

さらにバグ発見

評価関数の差分計算関連の初期化をごそっと忘れてました。 という訳で一晩分の結果がパー。リトライします。

致命的なバグを修正

昨日のバージョンには致命的なバグがあってちゃんと学習出来てなかったので、修正してリトライ。 それから、情報表示・ログ出力が不十分だったので、その辺も追加。 棋譜はボナンザ自己対戦の2000局と、将棋倶楽部24の棋譜約11万局があるので、学習用マシン…

私がボナメソに手を出そうとしている理由

唐突ですが、Bonanza Methodに手を出すつもりです。 …の話の前に、まずは今後やろうとしている事から。 やる事は「プランニング」で、要するに環境のモデルを用いた学習です。モデルというのは「エージェントの行動に対して、環境からどういう反応が返ってく…

Core i7 970は3.2GHzの6コア?

http://nueda.main.jp/blog/archives/004849.html 価格は$562との事ですので、今のi7 950と同価格帯で出るみたいですね。 時期が今年Q3と遅いのが難点ですが、私はそれを待つ事にします。

Seleneさんのブログ

http://d.hatena.ne.jp/SeleneShogi/20100201 おとなり日記で気付いたのですが、選手権新規参入のSeleneさんがブログを開設されたそうです。 名前は月探査機の「かぐや」と同じみたいですね。なかなかロマンチックな名前です*1。 ソフトの作りは局面クラスが…

危ない危ない、パラメータのセーブを忘れてた(汗

さっき作ったルーチン、学習をするだけして、アプリ終了まで一切セーブしていませんでした。 流石にそれじゃぁ実用性無いので、ちゃんとセーブするようにして一段落。

棋譜からの学習を試行中

プランニングを導入するにあたり、既存の棋譜からの学習(OR floodgate等の棋譜からの学習)と自己対戦での学習のハイブリッド構成が必要になる関係で、まずは棋譜からの学習単独でのテスト。 旧バージョンにも棋譜を使って学習するルーチンはあったんですが…