GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2011-12-01から1ヶ月間の記事一覧

年末大掃除

という事で、完了した項目はザックリ消して仕切り直し。 来年こそは学習を成功させたいなぁ… 方策勾配法での評価関数パラメータの学習 ※実装は完了。現在テスト中。 "変分ベイズ法による自然方策勾配の推定法"の調査 http://ci.nii.ac.jp/naid/110003496679 …

L1正則化を実装

パラメータの値が変に発散している対策にならないかと思い、L1正則化を実装しました。 とりあえず正則化係数の調整が必要なので、シングルスレッドバージョンを7通りの正則化係数で走らせています。正月明けまで走らせて、その後結果を見る予定。

次回選手権の参加者募集中らしいです

http://www.computer-shogi.org 私の所には参加経験者だからかCSA会員だからかでちょっと前にメールが来てましたが、CSAのサイトでも募集開始の告知がされていました。 ところで今回の選手権、私は惨敗する可能性が濃厚になってきました。いまだに3年前のパ…

VS Lesserkai

GA将!!!!!の方は評価項目全部ありで30万局ほど学習させ、それを4クライアントで合議したもの。対局条件は1手1秒。 んで、結果は149-2-24で勝率86.1%。95%信頼区間は80.1〜90.9。 …弱いですね。うーん…

おぉ、gps_lに勝ってる!

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/12/29/wdoor+floodgate-900-0+Gasyou_Atom-D510_2c4t+gps_l+20111229080002.csa 何があったかよく分かりませんが、まさか勝っちゃうとは。 やっぱり、合議を実装するとやや攻撃的になるのが効いてたんでしょう…

方策勾配法での学習再開

パラメータ設定がおかしいって可能性があるんで、二点変更して学習させてみます。 ランダムオープニング*1を無効に 学習率を一桁下げて0.0001に 前者は効果が不明なので外しました。後者は、学習後のパラメータが変に大きくなってる感じなんで、それ対策で。…

選手権の参加申し込み完了

学習のメドは全然ですが、とりあえず申し込んでみました。 マシンも未定。強くなったらデスクトップPC持ち込むし、弱けりゃノートで逝く予定。 さーて、んじゃァどこから手を付けるかなぁ…

ベイズ線形回帰をざっと実装してみた

まずはy=axという関数のaを近似する問題で。 普通の線形回帰(近似)より、収束速いし収束後の挙動も安定してます。 ただ、aが時間経過と共に変化してく、非定常環境では線型近似に劣ります。どうも、aの変化に学習がついていけてない感じ。 まぁ、私の理解…

ベイズ統計の本、買いました

Excelでスッキリわかるベイズ統計入門作者: 涌井良幸,涌井貞美出版社/メーカー: 日本実業出版社発売日: 2010/11/11メディア: 単行本購入: 16人 クリック: 32回この商品を含むブログ (9件) を見る とりあえず評価関数のパラメータ修正に使えないかと検討中。 …

ソフトマックス方策に詰将棋ルーチン呼び出しを追加

今までは自己対戦時には詰将棋ルーチン使ってなかったんですが、ルートノードでのみ軽く0.05秒ほど呼んでみました。性能低いんで3手・5手詰め位は確実に読んで、7手・9手になると運が良ければ読めるって程度の性能です。 んで、対局速度は今の所24時間あたり…

昨夜からの学習速度

引き続き方策勾配法で頑張っています。 で、方策にはソフトマックスを使ってるんですが、それだと「暫定最善手の評価値がxで温度がTだから、評価値yの手の選択確率はz以下だ」と分かります。 そこで、xとTから適切なウィンドウを設定する事で、zが閾値以下に…

GPW2001の論文集が届きました

とりあえず興味の有る所から読んでますが「合議のための多様な将棋プレイヤの集団学習」が面白かったです。 基本的にはBaggingで、それに加えてModel-based NCL(Negative Correlation Learning)という手法で、評価関数のパラメータ調整時に各プレイヤー間…

バグっぽいなぁ・・・

20:22:21 @ lib::reporting::ReportCollector::printReport() > GpD : 24642 20:22:21 @ lib::reporting::ReportCollector::printReport() > 先手の勝率 : 0.5 20:22:21 @ lib::reporting::ReportCollector::printReport() > 引き分け率 : 0 20:22:21 @ lib:…

アイデム エンジニアキャリアHacks共有プロジェクトに応募してみる

お題:5年後の「エンジニアの働き方」は、どう変わっていてほしいですか? えーっと、ヒジョーに俗っぽい事から言うと 終電で帰らなくていい 納期間際に徹夜しなくていい 休日に会社からの電話に怯えなくていい いきなり「仕様変わったから、ヨロシク」とか…

誰もが納得しそうなcatコマンド

こんばんは森岡ですほとんど誰も見てないでしょうけど2週間近く日記を放置してましたスイマセン _| ̄|○ んで、本題↓ http://d.hatena.ne.jp/teramako/20111207/p1 私もはじめてcatコマンドの存在を知った時は「何でネコ?」って思ったもんですが、その思い…