GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-04-09から1日間の記事一覧

一旦整頓

将棋の学習関連 TDLeaf(λ)エージェントを再実装。 方策をエージェントから独立させる。 学習中の各種統計情報の収集・表示ルーチン実装。 std::vectorあたりを勉強しとくこと。 王手将棋での予備実験。 εグリーディーとソフトマックス手法の比較。 評価関数…

Lesserkai相手に23勝0敗0分け

という訳で、今朝のパラメータ+ちょっと修正したプログラムでfloodgateに復帰。修正内容は乱数を少し大きく*1しただけです。 それから、学習用マシンには評価項目を増やしたバージョンをパラメータ持ち越しで投入。今の項目はこんな感じです。 駒割 絶対位…

現在10-0-0(vs Lesserkai)

20-0-0になったらfloodgateに投入します。

漫遇将棋の紹介記事 @ Yahoo!

http://headlines.yahoo.co.jp/hl?a=20090409-00000575-san-bus_all ざっと読んだ感じだとニューラルネットワークを使ってるッポイですけど、実際の所そこまでは明記されてないですし、詳細は不明。 とりあえず、なんか新しい事をしてて強いらしいという位は…

今朝までの分、約60万局

昨日の夜から学習開始して、何故か今朝8時40分頃に止まってたんで、そこまでの分。この時間は家を出た後ですし、エラーメッセージとかは特に見あたらなかったんで、本当に原因不明。 ともかく、ある程度学習出来てたと思うんで、Lesserkaiと一局指して貰いま…