GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-09-01から1日間の記事一覧

評価関数へ開放度の追加&その他色々

やった事。 開放度の評価 石の重みを進行度*1に応じて異なる値に 局面のundo()の追加 undo()は今まで無くて、先読みする場合はclone()してから手を進めてたんですが、開放度の実装したら+αでundo()が作れる様になったので追加。 でもあんまり速くなってない…

開放度

リバーシの評価関数の解説を見てると“開放度”ってヤツが頻繁に出てくるんですが、これって何なのかちょっと考えてみました。 基本的には「裏返した石の8近傍にある空きマスの数の合計」らしいんですが、要するに「隣接したマスが空いてるほど相手に取り返さ…

着手可能数の実装完了

つっても、合法手一覧を生成するメソッドは既にあるので、それを利用しただけですが。 (そういや、id:streakeagle:20070828:1188309666で書いた方法は、やっぱり便利です。評価関数の拡張をしていて実感。) んで、「Q学習で関数近似を行うと、学習結果が収…

予定変更

リバーシの時点で各種技術を実装して、効果を検証した上で将棋に移植します。 通常のコンピュータ将棋では出てこない用語が色々ありますが、実装したら軽く解説を書きます。 リバーシ関連 盤面の実装 評価関数の実装(あまり複雑な事はしない) 石の位置・手…

6x6リバーシの学習結果

2晩かけても収束していませんでした。というか、全然学習が進んでいない感じ。 理由を予測してみると、次のどちらか。 評価関数のキャパシティ*1が不足している。 4x4より解空間が大きくなったので学習が進んでいない様に見える 一つ目は評価関数を拡張して…

プリンタ購入

CanonのiP4300っつーヤツです。近所の家電量販店でVista x64対応のを探してきました。 んで、文字印刷専用のインクは綺麗だし、デフォルトで両面印刷機能があるし、結構満足。 今はメタ強化学習の論文を印刷中。