GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

短期

選手権の準備

明日・明後日は仕事で出来ないだろうから、今日中にやっとくべき事。 荷造り 強化学習の本を忘れずに 選手権・宿関連のメールを印刷&携帯に転送 PCの環境整備 ネットワーク関連の設定を変更しておく ログ・ソースのバックアップとかの準備 後12時間位あるの…

そろそろプログラムはFIXかな

ルートノードで合法手が1手だけならノータイムで指す 進行度を基準とした思考時間制御 USIでscore mate対応 LMRの短縮しない条件を追加 Ponder…は無理かな?諦めた LMRで「敵陣で敵の利きの無いマスに駒を打つ手は短縮しない」って条件で、駒種を「大駒のみ…

選手権までにやりたい事

ルートノードで合法手が1手だけならノータイムで指す 進行度を基準とした思考時間制御 USIでscore mate対応 Ponder…は無理かな?

学習時の情報表示周りを実装

シングルスレッド学習のコードをコピペしてちょこまかと修正したら完了。意外と楽でした。 とりあえずこれで一晩動かしてみて、問題無い様なら次に行きます。 History Heuristicでオーダリング。 静止探索。 もうちょっとまともな評価項目。 ベンチマーク用…

動かしてみて足りなかった分追加

History Heuristicでオーダリング。 静止探索。 もうちょっとまともな評価項目。 ベンチマーク用のコード整備。 パラメータのセーブ・ロード。 情報収集の枠組みを作る。 方策内でのウィンドウ設定及びオーダリング。 必要ならHistory Heuristicの拡張。 千…

大分進んだのでいったん整理

置換表は後回しにして、とりあえず評価項目の充実を急いだ方が良いかな? まぁ、ぼちぼちやっていきます。 History Heuristicでオーダリング。 静止探索。 もうちょっとまともな評価項目。 ベンチマーク用のコード整備。 パラメータのセーブ・ロード。 情報…

ベンチマーク用のコード実装

ssp同士を一手1秒で1000局対局させた棋譜があるので、その棋譜の局面から探索してNPSやら色々計測するコードを実装。 当面はこのコードを使って、必要な機能の実装と軽いチューニングをしていく予定。 んで、実装してて色々足りてない機能があったんで、その…

全幅・静止探索のテスト、とりあえず完了

YssTreeでログを見ながら、動作を検証してみましたが、多分大丈夫。 んで、短期的な残項目。 History Heuristicでオーダリング。 静止探索。 もうちょっとまともな評価項目 ベンチマーク用のコード整備。 置換表。 評価項目を一通り揃える(三駒の関係以外)…

とりあえずは今の方向で進めます

まずは短期。 探索ルーチンの修正 SEEでオーダリングを試してみる MTD-∞ ちゃんとプロファイルとる 中期。選手権まで。 将棋の学習関連 TDLeaf(λ)エージェントを再実装。 方策をエージェントから独立させる。 学習中の各種統計情報の収集・表示ルーチン実装…

細々と実装中

今日やった事。 直線探索を実装して、学習率の設定が楽になった。 駒割の重みの変化をファイルに書き出す。あわせて、ログ出力関係の追加。 昨夜からの一晩分のパラメータだと、学習率が高すぎる様な傾向だったので、今度は学習率を低めに設定して一晩走らせ…

結局昨日は一日中寝てました

ダメ人間まっしぐらです orz 一応、ルートノードでの枝刈りのパラメータ修正はやったので、その結果だけは後で見てみます。 ログ出力まわりの整理 評価関数の再実装 ついでに王将との相対位置評価を実装 ルートノードでの枝刈り とりあえず駒割の重み推移だ…

…むずい

ルートノードでの枝刈り(仮の最善手よりある程度評価値が低そうな手は、真面目に探索しないルーチン)ですが、昨日からやっててイマイチ良い結果が出てないです。 一応1.5倍程度の高速化はしましたが、副作用ありでこの程度だとちょっとなぁ…って感じです。…

しまった、更新してなかった

ログ出力まわりの整理 評価関数の再実装 ついでに王将との相対位置評価を実装 ルートノードでの枝刈り マルチスレッド化 探索ルーチンの修正 ちゃんとプロファイルとる 上の結果次第で、二駒の相対位置関係のチューニング

当面の方針として

ログ出力まわりの整理 評価関数の再実装 ついでに王将との相対位置評価を実装 ルートノードでの枝刈り マルチスレッド化 探索ルーチンの修正 ちゃんとプロファイルとる 上の結果次第で、二駒の相対位置関係のチューニング ログ出力は性能面以外でもメンテや…