GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2012-05-01から1日間の記事一覧

選手権の予定

が、変更になりました。急な仕事が入って。 具体的には、5月6日が出勤なんで前日の決勝は昼過ぎまで観戦して、それから帰る予定です。 という訳で宿の予約変更とかしないと。今ならまだキャンセル料不要だったはず。

異様に落ち着いてます

http://d.hatena.ne.jp/minute_hand/ ツツカナさんのブログを読んでふと思ったんですが、前回参加時の第20回選手権直前ほどのワクワクとかドキドキとかが今年はあんまり無いなァ、と。 前回は評価関数のパラメータ学習自体は失敗してましたが、並列探索を実…

気になる論文

インクリメンタルサポートベクターマシンによる価値関数の学習 強化学習におけるexplorationとexploitationの制御 もう一回カーネル法評価関数に手を出すなら、SVMにした方が良さ気だし、一度試してみたいです。単純に線形評価関数をカーネル法評価関数に置…

評価関数パラメータの分散って求めれないもんかなぁ…

個々のパラメータの分散が計算出来れば、それらを足し合わせて評価値の分散が求まるはず。で、自己対戦での対局時に「平均評価値+分散」が高い手を選べば、対局を重ねる毎に分散が小さくなっていって(=最適な値である確率が高くなっていって)良い感じに…