GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-01-07から1日間の記事一覧

入玉を忘れてた

何で、追加。他は以前通り。 将棋関連 将棋用の評価関数の実装 駒割 絶対位置による評価 王将との相対位置による評価 二駒の位置関係 王将の動ける範囲 王将周辺の利きの数 先後共通のパラメータを使う様に上記項目を修正 将棋で使う為に強化学習関連のクラ…

色々細々修正完了

上に書いた通り、TDLEaf(λ)関連です。 学習則の部分を重み修正直前の評価値を基準に。 対局中に詰みを発見した場合は、常にグリーディー行動を選択する様に修正。 詰んでいる場合は途中のノードの評価値も学習。 一つ目は、以前はエピソード*1中の評価値を基…

今週の予定

月曜:TDLeaf(λ)の学習部分修正 火曜〜水曜:評価関数の修正&みっちりテスト 木曜:千日手・打ち歩詰め関連の実装検討 金曜:酒飲んで寝る 週末:予備期間 さて、今日はウェブの巡回はサクッと済ませたし、バックアップは今やってるところだし、後は開発す…