GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2014-11-01から1ヶ月間の記事一覧

GAによる探索パラメータの学習

一応動く所までは来て、5五将棋でテスト中。 んで、現在3手+静止探索で学習した結果、枝刈り無しとの一致率90%・高速化率5.7倍*1になりました。 ただ、まだ全然深く読めないので、いろいろ試行錯誤している所です。 目標は「5五将棋の初期局面で、2秒以内…

REXstar実装完了

一応テストして、ちゃんと動く・テスト用関数で収束するのを確認。 んで、メタパラメータと目標関数を少し修正して学習用マシンに投入。 開発用マシンでは、並行してアサーション有効で一晩走らせてみますか。

チマチマ改良中

とりあえずを実装する事にして、論文の該当箇所は読みました。 今日中にテスト・デバッグを済ませて、探索パラメータ学習をさせつつ寝たいですね。

問題は一つ解決

上で書いたrastrigin関数で収束しない現象ですが、数式に間違いがあっただけでした。 んで、テスト関数では学習が上手く行くけど探索パラメータの学習はNGなので、探索部分にバグが有る可能性大です。 つー事で、ログ出力は後回しにしてデバッグしてみます。

今日帰ったらやる事

ログ出力機能を実装。 rastrigin関数でちゃんと収束しない原因を調査。 ログは、適応度の平均・最大値と各パラメータの平均・エースの値を出せばいいかな。 二つ目の収束しないのは、まずは論文のメタパラメータと値を揃えてテストしてみますか。

JGG+REXの実装

昨日書いた論文の手法ですが、一応それなりに動くようにはなりました。 試しに、論文で使用されているテスト関数の最適化は、論文とほぼ同じ結果が再現出来ました。 んで、そっから5五将棋での探索パラメータ調整をさせると、何故かちゃんと動かない… 探索ル…

論文読了

実数値GAのフロンティア 各種関数での最適化実験・考察がしっかりされてて、読んでいてさすがと関心しました。 んで、提案手法についても(多分)理解出来たので、これから実装してみます。 は実装が難しそうですし、今の私の条件では不要そうなので、を試し…

本日の成果 無し

いえ、細かいバグを潰したりはしたので完全に0ではないですが、ほぼ進展無し。 唯一の成果は、Fail-Lowした後にFail-Highする現象が「仕様」だと判明した事位ですね。 んで、GAで探索パラメータの調整をしてみるとどうなるか興味があるんで、今日はその準備…

Oh...

二つ上ですが、5五将棋での結果でした _| ̄|○ 本将棋の初期局面だとこんな感じ。137秒で20手。 後10倍程度高速化して、20手を10秒で読める様にしたいなぁ。 どうも、読みの深さによって評価値が激しく上下してるから、それを押さえ込めれればなんとかなる……

頭がパンク状態

探索木のログを眺めてるんですが、正常な動作と異常な動作が区別付かない… もう今日は無理ッス。おやすみなさい。

初期局面でイテレーション25回回った!!

記念にログ。 doIterativeDeeping() > time==0.00, 197.2kNPS, depth==1, window==(-1e+008,1e+008), score==0.032901, Exact. doIterativeDeeping() > time==0.01, 13.2kNPS, depth==2, window==(0.0309777,0.0348236), score==0.028939, Fail-Low. doItera…

Android 5.0とOpera Mobile Classic

スマホのブラウザはOpera Mobile Classicを愛用していたんですが、Lolipopは非対応らしいです。 で、代替のブラウザを探したんですが、Opera Mini以外に有望な選択肢は無し。 ただ、ClassicとMiniでは微妙に操作感が違うので、結構ストレス溜まります。 つー…

探索ルーチンのテスト中

…ログ出力のコードをベタベタ書いただけですが、早速心が折れました。 という訳で、今日の開発はこれまで! 風呂入って寝ます。

本将棋・5五将棋共に学習は順調に進行中

ただ、学習完了は明日夜以降になりそうなので、今日は帰ったら探索に手を入れますか。 とりあえず、Stockfish風の探索ルーチンにPV取得とログ出力を実装して、テストするのが先決かな。 初期局面で妙な現象があったんで、まずはその辺から調べますか。

来たーーーーーーーーーーーーーーーーーーッ!!

Nexus 5(EM01L)にAndroid 5.0 Lolipop更新通知来た!!!! よし、帰ったら早速アップデートしよう。

結局

対ssp(5五将棋モード)は勝率85%くらいになりました _| ̄|○ 気を取り直して、本将棋の方の学習に期待しましょう。

これは期待していいのか!?

5五将棋モードで三駒相対を実装して62万局学習させたパラメータ。探索深さは全幅3手+静止探索6手。 現在ssp相手に10連勝!!! 評価値の推移を見ていると、序盤からかなり優勢になってる対局が多い感じです。 出来れば今すぐ対局打ち切って「勝率100%」って…

評価関数のパラメータ数

三駒相対を実装して148万になりました。 もう一桁位は増やしても大丈夫そうだし、なんか新しい特徴を考えますか。

GA将!!!!!!!! 第2回将棋電王トーナメントバージョン&5五将棋バージョンを公開しました

下記URLからダウンロード可能となっています。 http://gasyou.is-mine.net/archive/index.html お問い合せはメール・Twitter・本ブログのコメント等でお願いします。

三駒相対の差分計算実装完了

1〜2割程度しか速くなってないですが、まぁいいか。 さて、次はGA将!!!!!!!!の公開準備をしますか。

今日やる事

GA将!!!!!!!! 電王トーナメントバージョンの公開 SR-PGLeafのアルゴリズムを整理 評価項目追加(三駒相対) Stockfishベースの探索ルーチンをテスト 来週やる、来週 とりあえず三駒相対の差分計算実装かなぁ。 差分計算を午前中に片付けて、午後からはGA将!!…

三駒相対の評価項目を追加

Bonanza風に言うと「PPP相対」になるのかな? とりあえず、昔のコードを引っ張りだして修正。アサーションに引っかからない程度には動いています。 差分計算は未実装なのでまだ遅いですが、とりあえず学習用マシンに投入。一晩走らせてみます。 明日は一通り…

Day After Day発売か!!!

Day After Dayアーティスト: FreQuency出版社/メーカー: FROMSOUNDRECORDS発売日: 2014メディア: CDこの商品を含むブログ (2件) を見る これで勝つる!

今週末にやる事

GA将!!!!!!!! 電王トーナメントバージョンの公開 SR-PGLeafのアルゴリズムを整理 評価項目追加(三駒相対) Stockfishベースの探索ルーチンをテスト

VS ssp(5五将棋モード)

結局、勝率85%前後になってダメでした。

VS ssp(5五将棋モード)

今朝時点のパラメータ(VAPSLeafで60万局弱学習時のもの)で連続対戦中。 今現在16-0-1で勝率94.1%。前にSR-PGLeafで学習したバージョンは89.4%だったので、それを超えてくれると嬉しいなぁ。 しかし、勝率90%を超えるとポロッと負けただけで勝率ガタ落ち…

よく分からん

メタパラメータ25種類のテストをしてみましたが、なんかよく分からない結果に。 βとτの2つあるんですが、τは値を0.1,0.3,1.0,3.0,10.0と変化させても収束速度には影響無し。 んで、ベータの方は大きいほど収束早いんですが、これは単にパラメータ更新幅が大…

Visual Studio Community 2013

Microsoft、“Professional”相当の無償版「Visual Studio Community 2013」を公開 - 窓の杜 VS2013の無償版にラインナップ追加だとか。 Professional相当って事は、PGOが使える? 上手く行けば多少の性能アップが見込めるんで、週末にでもインストールしてみ…

メタパラメータ設定

メタパラメータが2つあるんで、コマンドライン引数で指定可能に修正。 それから、5x5の25通りで学習させるバッチファイルを書いて学習用マシンに投入。 明日朝には結果が出てるはずなので、それを見て大体良さげなメタパラメータを採用します。

VAPSLeaf続報

三目並べで学習させて、ほぼ確実に*1収束する所までは確認しました。 メタパラメータは未調整ですが、それでも素のPGLeafより2〜3割程度収束が早い感じです。 もうちょっと調整をしてやれば更に高速化出来そうですので、まずは一晩かけて基礎データをとって…