GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-08-18から1日間の記事一覧

あうあう、まだダメダメ

メタエージェントMAがエージェントAにパラメータの値を指示するのですが、 Aは指示された値をそのまま使う Aは指示された値より0.5小さい値を使う のどちらでも、メタエージェントは0.5付近の値を指示しようとする・・・ お前らそんなに0.5が好きか、と。単…

やっぱダメだった

もうチョイ修正してリトライ中。

なんとなく原因判明(かも)

強化学習だと状態価値関数という、コンピュータ将棋の評価関数みたいなものがあって、それの学習率が低すぎたのが原因っぽい。 まぁ、評価関数がgdgdだとまともな行動は不可能ですわな。 んで、学習率を高くしてもやっぱ学習が遅い・・・ TD法の限界っつーか…

んで、勢いでハム将棋と対局

ハム6枚落ちに苦戦して、恥も外聞も気にせず穴熊に組んでやっと勝利。 最後は香車2枚を縦に並べて強引に突破したけど、良いのかそんなんで > 自分 あ、3枚並べりゃジェットストリームアタックだw

ちょ、メイドと将棋ってw

id:mkomiya:20070818:p11 すっげー面白いんですがw とりあえず4話までは観た。 ただ、これだけは言いたい。 「メイドさんはロングスカート長袖が好み」

メタ強化学習は一旦中断

普通の学習すらまだ出来てないのにメタ学習に行くのは無謀でした、と。 んで、まだあきらめられないのでメタメタパラメータ4種で一晩動かして、それでダメなら明日は○×ゲームの強化学習。 そーいやCore2って動かすプログラムによって温度変わりますね。同じ…