GA将 Ver.7の現状
とりあえず、三目並べの局面・探索・評価関数クラスは完成。
んで、後はPGLeafの学習ルーチンを実装すると一応動く形にはなります。
今回は前バージョンの反省を活かして色々改善しているんで、デバッグの効率も上がってウマウマです。
後、三目並べ・リバーシ・将棋の3ゲーム用のクラスがそれぞれ5個位ずつあるんですが、今回は#ifで囲って三目並べモードならリバーシ・将棋のクラスはコンパイルしないようにしたり。これでコンパイル時間は多少節約出来る、はず。
PGLeafは…どうかなぁ、1日2日あれば実装出来そうな気はしますが、やってみないと不明。
それから、Ver.6の本将棋の学習は、探索を静止探索のみだとこれ以上伸び代が無い感じなので、パラメータ引き継で全幅1手+静止探索で学習中。上手く行けば選手権で使います。
あ、そうそう。選手権の話。
ひょっとしたら諸々の理由で一次予選しか参加出来ない可能性大です。
最悪、0泊3日で夜行バスで行き帰りするかもしれません。
まぁ、対局するのはコンピュータなので、私が寝不足でも何ら問題無いんですが。
ただ、夜行バスだと荷物減らしたいんで、強化学習の本を布教用に持っていくかは未検討。
これ
- 作者: Richard S.Sutton,Andrew G.Barto,三上貞芳,皆川雅章
- 出版社/メーカー: 森北出版
- 発売日: 2000/12/01
- メディア: 単行本(ソフトカバー)
- 購入: 5人 クリック: 76回
- この商品を含むブログ (29件) を見る
と、これ
強くなるロボティック・ゲームプレイヤーの作り方 ~実践で学ぶ強化学習~
- 作者: 八谷大岳,杉山将
- 出版社/メーカー: 毎日コミュニケーションズ
- 発売日: 2008/08/28
- メディア: 単行本(ソフトカバー)
- クリック: 73回
- この商品を含むブログ (12件) を見る
なんですが、読みたい人います?
「見せろやゴルァ」とコメントしてくれれば持って行きますんで、よろしくです。反響無かったら今回は布教しない方向で。