GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2020-01-01から1ヶ月間の記事一覧

今年の世界コンピュータ将棋選手権は参加見送ります

当面は5五将棋の方に注力したいので、選手権は参加見送り。秋のGPW杯コンピュータ5五将棋大会に向けて頑張ります! それから、学習ルーチンの分散コンピューティング化ですが、完全に暗礁に乗り上げちゃいました。困りました…

障壁が固い…(分散コンピューティング化、続報)

クライアント側は大体実装完了して、さ~サーバとの通信・データ転送周りを作るぞーーー!! と思ってたんですが、技術的・セキュリティ的な大問題が発生・・・ まず検討したのが自宅サーバを公開して、クライアント側と直にやり取りする方法。ただ、公開す…

スターライトブレイカー カウントダウン中

まず、クライアントGUI(Javaで作成)から学習エンジン(C++)を起動して、基本的な情報のやり取り(Exeのバージョン情報をJava側に通知して、Javaからプロセス終了指示を出す)所までは出来ました。 …エンジン側のstderrを読み飛ばす処理忘れてて、「何故か…

まだちゃんと書いてなかったので、今年の大会参加予定

3月のUEC杯と5月のWCSC30は参加見送って、秋にあるはずのGPW杯コンピュータ5五将棋大会を目標に開発中です。 昨年のUEC杯後にも書きましたが、棋力向上は評価関数の精度向上と探索ルーチンの改良の二本柱で行く予定。 評価関数の方は、現在進行中の分散コン…

学習ルーチンの分散コンピューティング化に必要な事

サーバ・クライアントのプログラムの修正・実装 サーバ(Java:通信周りを実装) サーバ(C++:パラメータ更新周りを修正) クライアント(Java:GUIと通信周りを実装) クライアント(C++:自己対局&勾配計算周りを修正) ランキングのデータ集計&HTML化…

「強くてニューゲーム」の可能性を検証してみた@コンピュータ将棋界

現在のコンピュータ将棋開発の知識を持って20年前(2000年)または30年前(1990年)の世界に降り立ったとすると、どのくらいの強さのプログラムが作れるのでしょうか。当時最強だったものと比べての差はどうでしょうか>専門家の皆様(リプでなくても、どこ…

学習ルーチンの分散コンピューティング化を検討中

GA将?の学習ルーチンは、ミニバッチサイズ(1回のパラメータ更新に使用する、自己対局の棋譜の数)を大きくすると、学習が安定する傾向があります。 ただ、私のPC(Core i7 5960X)では、マシンパワーの関係上ミニバッチサイズは500~1000程度が限界です。 …

ログの可視化ツールを大幅アップデート

qiita.com 上記サイトを参考に、ログファイルの更新を監視してグラフ作成&Webサイトにアップロードする様にしてみました。(更新ごとだと10秒に1回とかになっちゃうんで、前回処理から一定時間以上は待つ作りになっています。) qiita.com それから、ログフ…

方策πのエントロピーにもとづく内発的報酬

が、もうちょっとで定式化出来そうな気がする。 動機 自己対局を通じた、コンピュータ将棋/コンピュータ5五将棋の評価関数の強化学習において、より良い報酬を設計したい。 大雑把な考え方 方策πのエントロピーが、行動選択の前後でどう変化したかをベース…

あけましておめでとうございます。

新年ももう2日になってしまいましたが、今年もよろしくおねがいします。 昨年を振り返ると、3月のUEC杯5五将棋大会で準優勝したのがピークで、以降はGA将の開発はほぼ進展無しでした。 昨年末に一つちょっとしたアイデアを思い付いて、現在は三目並べモード…