GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-04-01から1ヶ月間の記事一覧

おー、ちゃんと矢倉っぽく囲うんだ

昨晩からボナンザメソッドで学習してたパラメータを使用。 という訳で、今度はこれをベースに方策勾配法(PGLeaf)で学習させてみます。 上手く行けばボナンザメソッドの序盤と方策勾配法の終盤力が同居出来ないかなぁって皮算用しています。 オープン戦まで…

明日はオープン戦

とりあえず今走らせてる学習(内容は秘密…じゃなくて、上手く行ったら書く)が成功したら、そのパラメータで参加かな。 ダメだったら…Lesserkaiに20連勝すら出来ない弱々のがあるんで、それで行きますか。 とりあえず申し込んだんで、これで後戻り不可能。あ…

ダメだ、手が浮かばない

GA将の強化をしたいけど、どっから手を付けて良いものやら… とりあえずは方策のデバッグとか改良とか、その辺からかなぁ。 それと、選手権終わったら全面的に書き直したい。 将棋盤クラスのデータ構造から書き換えて、評価関数を少しでも軽くしたいし。 まぁ…

Gasyou、弱いなぁ…

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=Gasyou%2Bf77556b4cb8a223fec97549459a53fb4 とりあえず現状で一番良かったパラメータをfloodgateに投入したんですが、gps500に負け越…

SVRを使用したFutility Pruningのマージン決定

動的なマージンを用いるFutility Pruningという論文があるんですが、選手権後にこれを実装しようかと検討中。 んで、問題はマージン決定のフェーズと、決定したマージンを使用して探索するフェーズに分けなきゃいけないって所ですね。 今のGA将の学習方式だ…

ソフトマックス方策の再実装かんりょ〜

とりあえず動いてます。でも、前の実装との差は無い感じ。 気付かない所でエンバグしてて、実装しなおしたらそれが治ってるのを期待してたんですが、どうもそうではない様子です。 まぁいいや、コード自体は大分スッキリしたし、これで良しとしましょう。 現…

ソフトマックス方策を再実装中

前のインタフェースは色々ゴチャゴチャしてて使いづらかったんで、その辺を一新してみました。 とりあえず明日中には実装・テストが完了する予定。