GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2019-01-01から1年間の記事一覧

選手権までの開発スケジュール(案)

3月中:PGQの実装&アピー文書書く 4月頭~:評価関数パラメータの学習(4月20日頃までに完了させる) 4月20日~:思考時間制御のデータ収集&設定を決める ギリギリ、だなぁ。

UEC杯の振り返りと今後の予定

振り返り UEC杯ですが、GA将?は大きなトラブルは無く、無事指し終える事が出来ました。強いて言えば、2日目開始前にPCのコンセントが半分抜けかかっていて、突然電源が落ちる事があった位ですかね。まぁ、これも対局前に気付いたんで、大きな問題にはなりま…

UEC杯終了!

先程無事帰宅し、GA将?のUEC杯5五将棋大会は無事終了しました。家に帰るまでが大会です。 主催・運営の方々ならびに参加者の皆様には大変感謝しています。ありがとうございました。 さて、結果ですが、優勝はFairy-Stockfish。2位はGA将?・Nyanpass ・Shok…

明日開戦!!

明日16時からUEC杯5五将棋大会開催です。今年は優勝狙いたいので、がんばってきます(主にGA将?がw)。 まぁ、今となっては私に出来るのはオペミスしない様気を付ける事位ですかねぇ。

VS ssp(5五将棋モード・ハンディキャップマッチ)で最高勝率を更新!

Reflection-Play(反省会モード)を実装して76万局経過後のパラメータ。787勝108敗で勝率87.9%。あっさり最高記録を更新してしまいました。 この調子だと、そのうち勝率が90%超えそうなんで、ハンデの与え方を変えないといけないかも。GA将の方は全幅3手+…

対ssp(ハンディキャップマッチ)のベースライン更新

検証用マシンの環境が変わったので、再度計測。 以前は勝率82.0%だったのが、現在の環境では80.3%になりました。

「反省会モード(仮称)」のアルゴリズムについて

昨夜思い付いたアイデアで、ひょっとしたら使えるかも? という感じのがあるので、メモがてら書いてみます。 まず、前提として「自己対局での強化学習を行う」事とします。 学習開始直後は、初期局面から自己対局&パラメータ修正を繰り返しつつ、「優勢だと…

グッバイItanium!

pc.watch.impress.co.jp EPICの設計思想は割と好きだったんですが、ついに生産終了ですか。 TransmetaのCrusoe/Efficeonも大成功とは言えなかったみたいですし、汎用プロセッサでVLIWってのはちと厳しい感じなんでしょうかね。 私がコンピュータ将棋専用のAS…

千日手回避漏れの話(5五将棋モード)

連続対局用サーバを自作したらGA将の千日手回避漏れが検出出来る様になったんですが、チラホラと回避漏れが有ります。 んで、原因の局面を調べてみたんですが、意外と難しそうです。 まず、GA将?の探索ルーチンにはAspiration Searchと置換表を実装してあり…

対ssp(5五将棋モード・ハンディキャップマッチ)のベースライン更新

連続対局用サーバを実装したんで、前にプチ将棋を使って対ssp(ハンディキャップマッチ)の勝率75.6%を記録したパラメータでテスト対局。結果、勝率82.0%になりました。 千日手や打ち歩詰めの判定を考慮しても勝率が上がり過ぎているのですが、多分USIモー…

5五将棋用の連続対局サーバを自作

プチ将棋だと「千日手が先手の負けにならない」「打ち歩詰めが負けにならない」という問題があるので、5五将棋モードで連続対局させる為のサーバを自作。 現時点ではUSIしか対応していませんが、将来的には他のプロトコルにも対応させて、海外製のソフトとも…

ここ一週間ほどの進捗等

学習ルーチンを色々いじってみたのものの、結局今年1月2日に対ssp勝率75.6%を記録したのを超えられませんでした。 んで、現在はその最高記録達成時の設定に戻して再度学習中。多分、これがUEC杯に向けての最後のお願いになるはず。 それから、思考時間制御…

ちょっと修正したら、学習の立ち上がりは上々

PGLeaf+MCからPGLeaf+Q(λ)にアルゴリズムを変更して、昨夜から5五将棋モードで学習中。 現在、55万局経過後のパラメータでsspと対局中ですが、勝率65%前後。学習序盤としては上々の結果です。 このまま順調に強くなってくれれば良いんですが、どこまで伸…

Windows 10でキーボード入力が出来なくなった場合の対処

今日Windows 10 Proの開発用マシンを触っていたら、突然キー入力を受け付けなくなりました。 現象としては下記の通り。 画面描画は正常に行われている(時計の秒針やタスクマネージャーは動いている)。→フリーズでは無いらしい。 マウスクリックは認識した…

UEC杯までにやるべき事

評価関数パラメータの学習 思考時間制御のパラメータ調整 Ponderの検証 1.は今の学習ルーチンが良い感じなので、ジックリ時間をかけてやれば良いはずです。 2.に関しては、大会が20分切れ負けなので、最大思考時間を90秒か120秒に設定。んで、思考開始から1…

Adam、まだバグ持ち?

PGLeaf DreiにAdamを組み込んでみたんですが、RMSProp+Momentumより明らかに性能劣化しています。 まだどっかにバグが残っているかもしれないので、今からテストしてみます。

Adam実装完了&PGLeaf Dreiに組み込み完了

RMSProp+Momentumが思いの外良い感じだったんで、それならいっその事と思い、Adamを実装。 簡単にテストしてOKだったんで、PGLeaf Dreiに組み込んで学習用マシンに投入しました。 対ssp(ハンディキャップマッチ)で勝率80%、行けるかなぁ? 結果が出るの…

完全にミスったw

昨年末から学習回していたPGLeaf DreiのRMSProp+慣性項バージョン、レーティング上昇が頭打ちになったと思って学習止めて*1、止めた時点のパラメータでsspとやらせたら勝率上昇してた。 んで、慣性項はOFFにするのを忘れてただけなんで、OFFにして学習させ…

明けましておめでとうございます

既に2日になっていますが、本年も本ブログとGA将をよろしくお願いします。 今年の目標ですが、当面は3月のUEC杯5五将棋大会と5月の世界コンピュータ将棋選手権への参加ですね。 現在の学習ルーチンが割と良い感じなので、このまま学習を継続し、後は思考時間…