学習ルーチンの分散コンピューティング化に必要な事

TODO

サーバ・クライアントのプログラムの修正・実装サーバ（Java：通信周りを実装）サーバ（C++：パラメータ更新周りを修正）クライアント（Java：GUIと通信周りを実装）クライアント（C++：自己対局＆勾配計算周りを修正）ランキングのデータ集計＆HTML化…

2019-03-12

選手権までの開発スケジュール（案）

開発日記 TODO

3月中：PGQの実装＆アピー文書書く 4月頭～：評価関数パラメータの学習（4月20日頃までに完了させる） 4月20日～：思考時間制御のデータ収集＆設定を決めるギリギリ、だなぁ。

2019-01-11

UEC杯までにやるべき事

開発日記 TODO

評価関数パラメータの学習思考時間制御のパラメータ調整 Ponderの検証 1.は今の学習ルーチンが良い感じなので、ジックリ時間をかけてやれば良いはずです。 2.に関しては、大会が20分切れ負けなので、最大思考時間を90秒か120秒に設定。んで、思考開始から1…

2018-05-04

選手権で見えた課題とその対策

開発日記 TODO

まず、課題。駒割を重視しすぎて指し手がヌルい。圧倒的な学習時間（≒対局数）不足。テキトー過ぎる思考時間制御。 1.に関しては「15年前の評価関数だね」という感じの有り難い助言を頂きました。本当にその通りで、ここは改善の余地ありです。 2.ですが…

2017-11-05

実現確率探索に論理バグ発見

開発日記 TODO

バグと言うか、仕様の不備かな。Scoutしとけば良い所で、通常のαβウィンドウで探索してた。ただ、今は学習ルーチンの修正中なんで、グッと我慢して後で修正する事にします。

2016-01-04

選手権までにやりたい事

開発日記 TODO

評価関数のテスト＆デバッグ探索パラメータの学習まず、評価関数のテストには桜丸@紅莉鳥栖使いたいさん提案の「レベルアップ判定」を使わせてもらっています。 https://twitter.com/sakuramaru7777/status/673435935850127360 私の実装では、100局に1回レ…

2015-12-20

次回選手権までのロードマップ

開発日記 TODO

まず最終的な学習ルーチンの構成は「TDLeaf(λ)＋Softmax方策＋DNN評価関数」とします。時間があればPGLeafにしたいのですが、流石にそこまでは無理そうです。んで、上記構成を実現する為にやるべき事。 DNN評価関数の実装。 Convolutionは使用せずに、全結…

2015-10-31

今週末にやるべき事

開発日記 TODO

本将棋モード時のDropoutの挙動を修正フィッシャクロックルールの追加時間を思考時間制御に反映（GPW杯対策）とりあえず、これだけやれば大丈夫かな。

2015-05-06

来年に向けてのタスク

開発日記 TODO

完成形の目標はこんな感じ。線形の評価関数玉の固さをちゃんと評価出来る様にする普通のαβ探索第25回選手権バージョンをリファクタリングするだけで、それ以外は極力いじらない予定 16種類の評価関数による多数決合議対局時は、シングルスレッド探索ル…

2015-03-07

選手権までにやる事

開発日記 TODO

全幅探索部のハッシュ表の扱いを修正 Aspiration Searchの実装並列探索のチューニング（Split条件の見直し）打ち歩詰め判定の修正入玉勝ち宣言の扱いを修正（相手が宣言しない場合への対処）全幅3手＋静止探索で学習評価関数パラメータに関してはそこそ…

2015-02-22

選手権までにやる事

TODO

GAによる探索パラメータの学習（3月末まで）並列探索（4月中に）まぁ、可能なのはこれ位かな、実際。 GAの方は行き詰まり気味ですが、後1ヶ月でなんとか形にしたいですね。

2015-01-12

とりあえず合議で対局するのは可能になった

開発日記 TODO

まず、Stockfish風探索ルーチンは断念しました。理由としては、GAでのパラメータ学習が上手く行かなかった事が主な要因です。かと言って、数十あるパラメータを手調整するのは、私には無理です。そういう訳で、探索ルーチンはABC探索の方にリトライします…

2015-01-01

賀正

雑記開発日記 TODO

遅くなりましたが、あけましておめでとうございます。今年もよろしくお願いします。さて、一年の計は元旦にありと言いますので、とりあえず今年の（と言うか、選手権までの）TODOでも書いてみます。 Stockfish風探索ルーチンのテスト・デバッグ。上記探索…

2014-11-25

今日帰ったらやる事

開発日記 TODO

ログ出力機能を実装。 rastrigin関数でちゃんと収束しない原因を調査。ログは、適応度の平均・最大値と各パラメータの平均・エースの値を出せばいいかな。二つ目の収束しないのは、まずは論文のメタパラメータと値を揃えてテストしてみますか。

2014-11-16

今日やる事

開発日記 TODO

GA将!!!!!!!! 電王トーナメントバージョンの公開 SR-PGLeafのアルゴリズムを整理評価項目追加（三駒相対） Stockfishベースの探索ルーチンをテスト来週やる、来週とりあえず三駒相対の差分計算実装かなぁ。差分計算を午前中に片付けて、午後からはGA将!!…

2014-11-15

今週末にやる事

開発日記 TODO

GA将!!!!!!!! 電王トーナメントバージョンの公開 SR-PGLeafのアルゴリズムを整理評価項目追加（三駒相対） Stockfishベースの探索ルーチンをテスト

2014-11-04

選手権までのプラン

開発日記 TODO

2014年11月探索のStockfish化（シングルスレッド） 2014年12月並列探索正月休み探索のパラメータ調整（可能ならGAで自動化する） 2015年1月 VAPS 2015年2月評価項目の追加 2015年3月評価関数の非線形化 2015年4月チューニング以前書いてた、さくらの…

2014-11-02

選手権に向けてやりたい事

開発日記 TODO

評価関数は現状のコードをベースに改良基本は線形の評価関数状況次第では非線形に拡張する自己対戦からの強化学習でパラメータ調整 VAPS（Value and Policy Search）*1とαβ探索を組み合わせてみる評価項目を追加三駒関係探索はStockfish化並列探索各…

2014-05-07

プラン再考

開発日記 TODO

加筆＆ちょっと優先順位を調整。コンセプトギャンブルまがいの「当たればデカいけど、成功確率低い」事もどんどんやって行きます。下手な鉄砲も数撃ちゃ当たる！！！その為の方策として、手間がかかるパラメータ調整は全部学習ルーチンに押し付けます。具…

2014-05-06

明日やるべき事

TODO

GA将のウェブサイト更新（WCSC24のコメント更新＆バージョン表記を修正）今年一年のTODOリストを作成 Ver.8のプロジェクトを作成ブログの下書きを清書する

2014-05-05

来年に向けてのプラン

開発日記 TODO

鬼の笑う来年の話。ひとまず完成形はこんな形。昨日一昨日対局した感じだと、探索と評価関数の両方を頑張らないと上には行けないので、どっちも学習で何とかします。それから、マシンパワー（並列性）は基本的には合議で活用する方向です。グランドデザイ…

2014-04-25

枝刈り関連はほぼ完了

開発日記 TODO

以下は実装済み。 LMR（パラメータ調整中） Null Move Pruning（パラメータ調整中） Futility Pruning・Extended Futility Pruning（パラメータ調整中） Transposition Table Ponder 以下は未実装で、やってみたい。グローバル詰みテーブルの実装頓死チェ…

2014-04-22

細々更新

開発日記 TODO

以下は実装済み。 LMR Null Move Pruning Futility Pruning（パラメータ調整中） Transposition Table Ponder 以下は未実装で、やってみたい。 Extended Futility Pruning Aspiration Search グローバル詰みテーブルの実装