GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2011-10-26から1日間の記事一覧

方策勾配法とカーネル法を組み合わせれないかと検討中

以前に自然方策勾配法の実装を検討した時は、パラメータ数が多すぎて無理(メモリに載らない)という理由で断念しました。ですが、STRさんの手法を真似てカーネル法を使えば、パラメータ数を減らせれるので自然方策勾配法が使用可能ではないかと。 低次元の…

もう、Ponder無しでいいや

思考時間が多少長くなったくらいじゃどうにもならない感じですし、Ponderは後回しにします。 という訳で、とりあえずは方策勾配法での学習にリトライしてみます。 シグモイド関数無しでの方策勾配法 実装は完了。現在テスト中。 レポート収集系の整理 パラメ…

ガーン

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/LATEST/players-floodgate14.html Gasyou_Atom-D510_2c4tが1c2tよりR下になってます。 上位のFireflyやBlunderXX-r3780_4cに勝てる事はあっても、対gps500の勝率が上がらないのが原因でしょうか。 合議を実装して…

グローバル詰みテーブルの連続対戦結果

対sspで一手一秒。232-1-88で勝率72.5%。95%信頼区間は67.3〜77.3。 前の結果だと勝率70.6%なので、あんまり伸びてないですね。う〜ん… あ、それから、floodgateで昨日落ちまくっていたのは0除算エラーが原因でした。現在は修正済み。対局相手の皆さんに…