GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-02-01から1ヶ月間の記事一覧

修正完了

けど、まだ見直すとポロポロとバグが出てくる気配なんで、もう一度印刷して見直してみます。 すぐ見ると効果薄いみたいだから、明日にでも見ますか。 さて、空いた時間はどうしよう。UCTの論文でも読みますか。

という訳で、ここからはMTD(f)

印刷したソースを読んでみると色々細々バグがあったんで、まずはそれを潰してみます。 てか、相変わらずコピペは鬼門だ。

パラメータの使用頻度に応じたボーナスの加算による探査の促進

ざっくり書くと、使用頻度の低いパラメータに対して局面評価時にボーナスを与える事で、使用頻度の低いパラメータを使う局面の出現率を高めよう、という事です。 これだけでは訳分からないので、まずは既存の方式の問題点。 評価関数の駒割を修正する前は、…

公衆電話のバグ

http://www.itmedia.co.jp/enterprise/articles/0802/04/news086.html まだあったんだ。 あ、いや、バグの話じゃなくて公衆電話自体の話。 そういや最近見てないなぁ、公衆電話。

Skulltrail

http://pc.watch.impress.co.jp/docs/2008/0204/tawada130.htm ぶっちゃけ「SLIの使えるXeonプラットフォーム(ただし名前はCore 2 Extreme)」って感じ。 注目は一般的なLGA775用のCPUクーラーが使えるって所と、Xeonにも対応する所。 ・・・って、CPUは完…

ISSCC

http://pc.watch.impress.co.jp/docs/2008/0204/isscc01.htm 前日レポートが出ています。 気になるのは2/4 SunのRock。トランザクションメモリをサポートするらしい。 それから2/5にIntelのSilverthorne。こっちは自分で使うかもしれなんで興味津々。 Silert…

NehalemのCPU-Z

http://xtreview.com/addcomment-id-4172-view-Intel-Nehalem-cpuz.html CPU-Zという、CPUの情報を表示するツールのスクリーンショットがありました。 真偽の程は不明ですし、仮に本物だとしても正しく表示出来ているとは限りませんが、とりあえずネタとして…

今日やったとこまで反映&細々修正・追加

将棋関連 デバッグ 将棋で使う為に強化学習関連のクラスをC++に移植 TDLeaf(λ) αβの高速化 MTD(f) 反復深化 ハッシュ 【保留】実現確率探索 OR ABC探索 Killer Move メタ強化学習のC++への移植 静止探索に脅威の考慮を追加 将棋のルールの細かい部分の実装 ←…

MTD(f)完成

とりあえずコンパイルエラーが無くなる所まで。 探索木はYssTreeで出力する様にしてるんで、明日は動かしながら読み筋を見てみます。 これで従来比4倍位に高速化してくれると嬉しいなぁ。 ちなみに今の形。 基本は手数打ち切りのMTD(f) 反復深化 全幅探索 Ha…

あともうチョイでMTD(f)完成

ルートは昨日作って、静止探索はさっき完成したから、あとは通常探索部分を作ってつなげるだけ。 ただ、ハッシュを使うから色々面倒なんだよなぁ。 とりあえずMTD(f)の論文と去年作ったコードを見ながらやりますか。

二駒の位置関係の改良

改良と言うか、学習を速く進める為の修正。なにしろ十分な学習時間が取れなさそうなので。 今の実装だと二つの駒の絶対位置で評価しています。例えば2二の後手角と2八の先手飛車、の様に。 で、これを二つの駒の相対位置で評価しようかと検討中。例えば後…

王将移動範囲を一時的に無効に

ファイルに保存したパラメータを見てみると、王将8近傍の移動可能なマスの数の評価が高すぎるのが、ちゃんと囲ってくれない原因かもしれません。 という訳で、一時的に王将の移動範囲の評価を無効にして学習させてみます。 てか、これでちゃんと囲う様になっ…

MTD(f)、まだ途中

とりあえずルートノードだけ作った。後はほぼ同じコードの使いまわしだから、多分明日には終わる。

次回選手権参加チーム

http://www.computer-shogi.org/blog/wcsc18_52_entries/ コンピュータ将棋協会blogさんで書かれていますが、申し込みは52チームになったそうです。 参加者リストを見てみると初参加が8チームとけっこうな数です。 んで、私の位置を見てみると真ん中あたりな…

Killer Moveを実装しようかなぁ

現在手のオーダリングはProb Heuristicという、History Heuristicを改悪したバージョンを使ってるんですが、これだと「手の良し悪しの比較」は出来ても「一番良さそうな手の取り出し」が出来ません。 正確に書くと、出来るんだけどもの凄く時間がかかります…

香車の価値は

学習率0.001だと6000局ほど終わっても駒割すら学習出来てない感じです。 まぁ、数日はMTD(f)の実装にかけるんで、その間に学習してもらいましょう。 ついでに、ある程度バグは取れたと思うんで、アサーションを無効にしたバージョンで学習中。これで多少速く…

MTD(f)実装中

id:streakeagle:20080131:1201790524で書いた再起呼び出し先ですが、醜かろうがなんだろうがコード量を減らせるのは魅力的なんで、引数を見て分岐する事にします。 後気をつける事といえば、ハッシュカット時のPVの扱いでしょうか。 TDLeaf(λ)をやってる関係…

Nehalemの嫌な噂

http://xtreview.com/addcomment-id-4164-view-Bloomfield-will-cost-less-then-400-dollars.html ハイエンドデスクトップ向けのBloomfieldとミドルレンジ向けのLynnfieldではソケットが違うという話でしたが、今まではBloomfieldはCore 2 Extreme後継だけだ…

ニコニコ動画でコンピュータ三目並べ

http://blog.bugyo.tk/lyrical/2008/02/post_43.html http://www.nicovideo.jp/watch/sm2197148(要アカウント) この前も話題にしたリリカル☆LispやPostScriptでLispの開発者の方が、今度はタイトルのものをやっちゃったそうです。 んで、対局してみました…