GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2010-05-01から1ヶ月間の記事一覧

並列化完了

以前もやった事のある方式ですし、そんな複雑な訳でも無いのでサクっと完了…したって事はなく、微妙につまずきつつ何とか実装しました。 学習用マシンは4コア8スレッド動作なので、以前より大分対局数は稼げてます。 問題は収束速度なんですが、こればっかり…

ようやくTreeStrap(minimax)がちゃんと動いたかも

学習経過のグラフはこんな感じ。 まだ歩の価値が高すぎたりしますが、もうちょっと時間をかければちゃんとした値に落ち着くはず(学習用マシンの経過を見る限りでは)。 んで、どうもグラフを見てると収束が遅い様なので、ここいらで並列化してみます。 探索…

ランダム指しプレイヤー相手に対局させてみた

565勝0敗。Eloレーティングで800以上の差はあるみたいなんで、強くなってるのは確かでしょう。 ただ、問題はssp相手に全然勝てない事。うーん、どうしたもんか。

一度TreeStrap(minimax)に戻ってみる

やっぱり基本はTreeStrap(minimax)だろうという事で、TreeStrap(αβ)の改良は後回しにしてTreeStrap(minimax)の修正。 TreeStrap(αβ)で入れてみた、内部ノードから静止探索を呼んでそのPV末端の評価値を修正するコードを、TreeStrap(minimax)でも実装してみま…

ようやくsspに勝てた

前は20戦全敗だったのが、開発用マシンで走らせてたバージョン(内部ノードから静止探索を呼ぶやつ)だと1勝1分18敗に。一つでも勝てる様になったのは、多少進歩したって考えていいのかな。 ただ、まだ学習がちゃんと収束していない感じがあるんで、学習率を…

モノは試しって事で、相関係数調べてみた

SEEはまだ実装してないんで、静的評価値と静止探索値の相関。 んで、相関係数0.83。意外と相関高いです。 となると、目標値の設定がマズイんじゃなくて、駒の取り合いの途中の局面の特徴を用いているのがマズイって可能性もあります。 という訳で、静止探索…

TreeStrap(αβ)をしつこく修正中

今度は内部ノードの評価値が決まった時点で評価関数のパラメータを修正する様に変更。論文のアルゴリズムとは違いますが、これで上手く行けばラッキー位に考えて試してみます。 それから、一つ考えていたのは、内部ノードでSEEを使って目標値の補正を出来な…

TreeStrap(αβ)がなかなか上手く動かない

駒割自体はちゃんと学習出来ているらしいんですが、それでもsspと対局すると全然勝てないです。 んで、今日はLeafノードでの目標値の計算がおかしかったのを修正。ウィンドウ位置を見ずに目標値計算しちゃってました。 それから、設定変更してLMRを無効に。R…

TreeStrap(αβ)だと上手く行ってるっポイです

学習率0.1**6でやったバージョンだと、駒割位はちゃんと理解している雰囲気です。 学習率は0.1**6〜0.1**7の間位がベストかも。前者だと収束後に値の上下が激しいし、後者だと収束遅い。 という訳で、学習率を0.1**6から始めて、1000局かけて0.1倍まで減少、…

TreeStrap(αβ)を実装

TreeStrap(minimax)がどうにも上手く行かないんで、半ば現実逃避気味にTreeStrap(αβ)を実装。 …多分上手く行かないんだろうなぁ。多分。

学習率の調整中

pow( 0.1, 7 )だと小さすぎたので、もう1,2桁上げてリトライ。学習用マシンと開発用マシンで並行して走らせときます。 …今日の開発は以上。だってやる事無いんだもん。

ようやく選手権用PCを開梱

キーボードもいつものに戻って、これでしっくり来る環境が戻りました。 選手権用PCこと学習用マシンには、当面TreeStrap(minimax)で学習してもらう事にします。シングルスレッドなんでCore i7が勿体無いですが、まぁそこは作りかけなんで。

TreeStrap(minimax)でちょっと修正

直線探索(って名前だったと思う、多分)を実装。これだと、学習率0.01だと学習後に誤差が丁度1%減る様になります。 TreeStrap(minimax)の論文だと直線探索してないかもしれませんが、私はあった方が学習率の設定が楽になるので。 それから、その修正時に評…

そういえば合議で一つ思い出した

選手権の時にBonanza Felizチームの方にお願いしたんですが、「個々の思考エンジン」と「合議で指し手を決めるエンジン」の区別の付きやすい名称って欲しいですよね。 私はアンサンブル学習にならって「弱エンジン」「強エンジン」と読んでいるんですが、“弱…

ここらでちょっと夢でも語っておこうかと思います

一言で言うと「T2Kオープンスパコンを乗っ取る」。これだけです。 乗っ取ると言ってもクラッキングとかそういう話ではなくて、プロ棋士対コンピュータ将棋の対局の話。 前提条件として、FAQから一部引用します。 Q: 対戦ソフトウェアは既に決まっているか A…

ここ数日の状況

コンピュータ将棋以外でちょっとゴタゴタしてて、開発日記を書いてる暇がなかったんで。 とりあえず5五将棋はある程度ちゃんと動いてます。少なくとも、アサーションに引っかからない程度には。 ただ、一件修正漏れがあって、駒を打てる段の判定が本将棋のま…

次回選手権まで残り51週なワケですが…

この一週間は割と無駄にダラダラと過ごしちゃったかなぁ。反省。

5五将棋に対応中

TreeStrap(minimax)のテスト用に、5五将棋対応のコーディング中。 将棋盤クラスを作る時に本将棋・5五将棋の両対応を意識した作りにしていたので、比較的楽に進んでいます。 とりあえず今は自己対戦してTreeStrap(minimax)で学習する所までは完成。上手く学…

来年に向けてやりたい事

自己対戦での学習を成功させる(とりあえずTreeStrap) 複数評価関数での多数決合議 ABC探索 相手番に対局中の局面から自己対戦して学習する(Ponderもどき) 現実的には全部は無理でしょうから、この中から2つ出来たら万々歳ですね。 今回の選手権期間中に…

選手権終了

決勝リーグは激指の優勝で幕を閉じました。激指チームの皆さん、おめでとうございます。 また、運営・参加者の皆さん、お疲れ様でした&ありがとうございました。

昨日の一次予選の振り返りなど

全局だと時間がかかりすぎるので、最後2局だけ。 奈良将棋さん・ponanzaさんに順当に負けて、なり金将棋さん・無明さん・あうあう将棋さんには勝ち、3勝2敗で迎えた第6局。あと一つ勝てばソルコフ*1しだいで予選突破、という状況でした。対局相手は臥龍さん…

宣言!

一つ目、一年かけて貯金して、来年はXeonデュアルソケットマシンで参戦します。 二つ目、貯金の一環として、今日から禁煙します。 ちなみについ2ヶ月ほど前の禁煙宣言ですが、HYBRID W-ZERO3買うまでは続きました。が、その後また吸いはじめちゃったんで、改…

二次予選に行ってきました

まずは結果から、3勝6敗の20位で二次予選敗退。まぁ、順当な結果です。 勝った相手は稲庭将棋さん・ツツカナさん・隠岐さんで、全員一次予選からの突破組。言い換えると、まだ勝てる可能性のある相手です。負けた相手は竜の卵さん・TACOSさん・YSSさん・備後…

一次予選から帰ってきました

結果は中継ページとかを見てもらうとして、結果だけ書くと5勝2敗で一次突破出来ました。 …すいません、帰りに有志で飲みに行って、飲みすぎて無茶苦茶酔ってるんで自信無いです orz ともかく、突破出来たのは確からしいんで明日も電通大に行ってきます。 朝…

朝〜 朝だよ〜

昨夜は緊張していたのか、あまり眠れませんでした。 と言うか、寝たには寝たんですが夜中に10回以上(多分)目が覚めて、いまいちすっきり寝た気になれません。 まぁ、寝坊しなかっただけマシだと考えて、前向きに受け取っておきます。 今日はこの後朝食→か…

LANテスト行ってきました

無事テストは完了。後は明日の本番を待つだけです。 今日もこれから開発する人もいるでしょうが、私はもう酔っ払って寝ちゃいます。 それでは、運営・参加者の皆様、明日からよろしくお願いします。

朝〜

今から半日かけて移動です。