GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-08-26から1日間の記事一覧

バックアップが終わらない

OSをVistaにして以降ろくにバックアップ取ってなかったんですが、ぼちぼち消えると困るソースが出てきたんでバックアップ中。 ソフトはDisk Mirroring Toolっつーのを使ってます。 んで、ほぼ完全にミラーリングしてる状態なんで、もう時間がかかってかかっ…

将棋用の強化学習を実装するまで

リバーシの盤面の実装 リバーシの必勝読みの実装 リバーシ用の評価関数の実装(あまり複雑な事はしない) ← ここまでの目標 9月2日 将棋で使う為に強化学習関連のクラスをC++に移植 詰め将棋の実装 将棋用の評価関数の実装 ← ここまでの目標9月中 絶対位置に…

リーチ判定ルーチン(仮称)実装完了

将棋で言うと、一手詰めと頓死判定が出来る様になったレベルです。 んで、結果。収束するまでの対局数が約7万→約3万5千に半減。もうちょっと減ると思ってたけど、見込みが甘かったですねぇ。バグかもしれないんで、も一回ソースを見てみます。 けどまぁ、こ…

勝率・行動価値の出力完了

・・・約3万回対局しても収束してないです。 やっぱあれか、リーチしてるのにそっぽに打ったり、相手のリーチを止めなかったりするから遅い? リーチかどうかだけ見て手を決めるっていう、将棋で言う詰め将棋ルーチンみたいなのが必要だろうか。

HTML化コードの移植完了

ざっと見てみると、割とちゃんと学習してるっぽい。 んで、ちょっと時間かけて動かしてみます。

三目並べのマルチスレッドは大体完成

ただ、学習の様子をテキストで表示するだけなので、ちゃんと学習してるかどうかは不明。 てな訳で、今度はログの出力関係を作らないと。 とりあえずは、以前作ったノードと価値関数のHTML化コードを移植して、あとは勝率や初期配置での行動価値の出力ですね。