GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2014-10-01から1ヶ月間の記事一覧

このCPU、久々に面白い!!!

http://pc.watch.impress.co.jp/docs/news/20141031_674098.html 一部の演算にエラーを許容する事で消費電力を削減しようという事らしいです。 んで、現在のCPUは消費電力を一定枠内*1に収めたうえで、可能な限り性能を向上させる必要があります。 なので、…

電王トーナメントバージョンをFix

エレガント詰めルーチンは断念しました。 正確に書くと、ルーチン自体は実装できた(はず)なんですが、通常探索と喧嘩してしまいました。 という訳で、Fixと書くとカッコいいですが、「前回選手権バージョンほぼそのまま」です _| ̄|○ これじゃぁ、予選突…

さて

エレガント詰めルーチンの実装を開始しますか。

電王トーナメントバージョン

前から連続対戦させてたのは、最新版から見て240-18-219で勝率52.2%になりました。 という訳で、最低ラインの「選手権と同等の棋力」ってのはクリア。 さて、後は詰将棋ルーチンに手を入れますか。

GA将!!!!!!!! エレガント詰めルーチン

「Labyrinthus辱め詰め」に触発されて、面白い詰将棋ルーチンを作れないかと検討中。 んで、風呂の中でザックリと構想だけねってみました。 可能な限り長手数での勝ちを選ぶ。 自分の駒(盤上・駒台とも)が少ないほど加点。 自玉と敵玉が近いほど加点。 ス…

小説執筆支援ソフト

http://www.itmedia.co.jp/news/articles/1410/28/news109.html 「芝浦工業大学」って文字を見て「五十嵐先生かっ!?」と思ったら違いました。 んで、「プロトコル解析法」っていう気になる単語があるんで調べてみましたが、被験者の発話内容から思考内容を…

今更 第23回世界コンピュータ将棋選手権

ひまわり対GA将!!!!!!!の動画を見つけたので掲載。あ、うp主≠私です。 結局、前回の選手権ではリベンジ出来なかったんですよねぇ。 という訳で、トーナメントで当たるのが楽しみです。強化学習勢としては、負けられない戦いです。

電王トーナメントに向けて

Softmax実現確率探索のパラメータ学習はひとまず保留として、αβ探索のコードを復活&テスト中。 選手権時の評価関数パラメータを使用して、現行バージョン(トーナメントに出すやつ)と選手権バージョンで連続対戦中。 現在8-1-7なので、多分エンバグはして…

このままだと

今週末も成果無し&電王トーナメントは選手権バージョンで参加… やばい、何とかしないと。

「History Heuristicのパラメータをプラスにするだけの簡単なお仕事」が出来ない

現在、Softmax実現確率探索を実装中です。 これがどういう物かと言うと、方策勾配法で局面遷移確率計算用関数のパラメータを学習するアルゴリズムです。探索自体は、激指の実現確率探索とほぼ同等。 んで、遷移確率計算には着手の表面的な性質(移動前後のマ…

昨日のバグ

http://d.hatena.ne.jp/Gasyou/20141022/1413978098 バグとしては1つで、エラーとして現れる現象が2種類あったみたいです。 で、原因は配列の領域オーバーによる他の変数の破壊でした。 とりあえず対策して、現在動作テスト中。一晩走らせてエラーにならなか…

あれ、バグが2つ同時に顕在化した?

一つは浮動小数点型の値がQNaNになるバグで、アサーションに引っかかる(エラーメッセージも出る)。 もう一つはよく分かんないけど、エラーメッセージ無しで落ちる。 現象としては2種類あるけど、根っこは同じって可能性もありますが、2つバグが有る可能性…

EM01L Android 4.4.4でのART有効化方法

設定画面に「{}開発者向けオプション」が表示されていなくて、仮想マシンにARTを使用出来なかったので対策をメモ。 http://smhn.info/201311-android-developer-option 上記サイトを参考に、「端末情報→ビルド番号」を連続タップして開発者になり、無事成功。…

VS ssp(5五将棋モード)

合議用SR-PGLeafで64万局ほど自己対戦したパラメータ。クライアント数は16。探索深さは全幅1手+静止探索1段目6手。 んで、バグってて連続対戦が途中で止まってましたが、その時点までで105-?-19で勝率84.7%。まだまだですね。 昨夜からほぼ丸一日かけて290…

合議SR-PGLeafの実装中

とりあえずザックリテストしたんで、一晩アサーション有効で走らせてみます。 合議クライアントの学習法は色々考えられますが、私は16種類の評価関数でリーグ戦をしながら学習していく方式を選びました。 これだと、各クライアントがそれぞれ異なった経験を…

VS Lesserkai

本将棋モードでSR-PGLeafを使って評価関数パラメータのみ学習したバージョン。 結果は434-0-1で勝率…はいいか。 今朝時点の11万局ほど学習したバージョンですので、sspを相手にするにはもうちょっと対局数を増やす必要があるかと思います。 とりあえず、寝る…

第8回UEC杯 5五将棋大会

http://minerva.cs.uec.ac.jp/~uec55shogi/wiki.cgi?page=%C2%E88%B2%F3UEC%C7%D5+5%B8%DE%BE%AD%B4%FD%C2%E7%B2%F1 に参加しようかと検討中…なんだけど、電王トーナメントとか色々あって旅費を捻出出来るかが微妙。 ただ、1/128里眼さんとかK55さんとかにリ…

ぬぅ、上手く行かん

どうあがいても探索パラメータの学習が上手く行きません。バックアッププランも含めて全滅。 という訳で、気分転換として合議用評価関数の学習をやってみます。 …まぁ、今日は学習の下準備で終わりそうな感じですが。

Experience Replayを実装

探索ルーチンの学習が行き詰まり気味なので、気分転換も兼ねてExperience Replayを実装。 どういう手法かというと、過去の局面・指し手・報酬を全て記録しておき、その中からランダムサンプリングしたものを使ってパラメータ修正を行うというもの。 どうも、…