2008-02-01から1ヶ月間の記事一覧
けど、まだ見直すとポロポロとバグが出てくる気配なんで、もう一度印刷して見直してみます。 すぐ見ると効果薄いみたいだから、明日にでも見ますか。 さて、空いた時間はどうしよう。UCTの論文でも読みますか。
印刷したソースを読んでみると色々細々バグがあったんで、まずはそれを潰してみます。 てか、相変わらずコピペは鬼門だ。
ざっくり書くと、使用頻度の低いパラメータに対して局面評価時にボーナスを与える事で、使用頻度の低いパラメータを使う局面の出現率を高めよう、という事です。 これだけでは訳分からないので、まずは既存の方式の問題点。 評価関数の駒割を修正する前は、…
http://www.itmedia.co.jp/enterprise/articles/0802/04/news086.html まだあったんだ。 あ、いや、バグの話じゃなくて公衆電話自体の話。 そういや最近見てないなぁ、公衆電話。
http://pc.watch.impress.co.jp/docs/2008/0204/tawada130.htm ぶっちゃけ「SLIの使えるXeonプラットフォーム(ただし名前はCore 2 Extreme)」って感じ。 注目は一般的なLGA775用のCPUクーラーが使えるって所と、Xeonにも対応する所。 ・・・って、CPUは完…
http://pc.watch.impress.co.jp/docs/2008/0204/isscc01.htm 前日レポートが出ています。 気になるのは2/4 SunのRock。トランザクションメモリをサポートするらしい。 それから2/5にIntelのSilverthorne。こっちは自分で使うかもしれなんで興味津々。 Silert…
http://xtreview.com/addcomment-id-4172-view-Intel-Nehalem-cpuz.html CPU-Zという、CPUの情報を表示するツールのスクリーンショットがありました。 真偽の程は不明ですし、仮に本物だとしても正しく表示出来ているとは限りませんが、とりあえずネタとして…
将棋関連 デバッグ 将棋で使う為に強化学習関連のクラスをC++に移植 TDLeaf(λ) αβの高速化 MTD(f) 反復深化 ハッシュ 【保留】実現確率探索 OR ABC探索 Killer Move メタ強化学習のC++への移植 静止探索に脅威の考慮を追加 将棋のルールの細かい部分の実装 ←…
とりあえずコンパイルエラーが無くなる所まで。 探索木はYssTreeで出力する様にしてるんで、明日は動かしながら読み筋を見てみます。 これで従来比4倍位に高速化してくれると嬉しいなぁ。 ちなみに今の形。 基本は手数打ち切りのMTD(f) 反復深化 全幅探索 Ha…
ルートは昨日作って、静止探索はさっき完成したから、あとは通常探索部分を作ってつなげるだけ。 ただ、ハッシュを使うから色々面倒なんだよなぁ。 とりあえずMTD(f)の論文と去年作ったコードを見ながらやりますか。
改良と言うか、学習を速く進める為の修正。なにしろ十分な学習時間が取れなさそうなので。 今の実装だと二つの駒の絶対位置で評価しています。例えば2二の後手角と2八の先手飛車、の様に。 で、これを二つの駒の相対位置で評価しようかと検討中。例えば後…
ファイルに保存したパラメータを見てみると、王将8近傍の移動可能なマスの数の評価が高すぎるのが、ちゃんと囲ってくれない原因かもしれません。 という訳で、一時的に王将の移動範囲の評価を無効にして学習させてみます。 てか、これでちゃんと囲う様になっ…
とりあえずルートノードだけ作った。後はほぼ同じコードの使いまわしだから、多分明日には終わる。
http://www.computer-shogi.org/blog/wcsc18_52_entries/ コンピュータ将棋協会blogさんで書かれていますが、申し込みは52チームになったそうです。 参加者リストを見てみると初参加が8チームとけっこうな数です。 んで、私の位置を見てみると真ん中あたりな…
現在手のオーダリングはProb Heuristicという、History Heuristicを改悪したバージョンを使ってるんですが、これだと「手の良し悪しの比較」は出来ても「一番良さそうな手の取り出し」が出来ません。 正確に書くと、出来るんだけどもの凄く時間がかかります…
学習率0.001だと6000局ほど終わっても駒割すら学習出来てない感じです。 まぁ、数日はMTD(f)の実装にかけるんで、その間に学習してもらいましょう。 ついでに、ある程度バグは取れたと思うんで、アサーションを無効にしたバージョンで学習中。これで多少速く…
id:streakeagle:20080131:1201790524で書いた再起呼び出し先ですが、醜かろうがなんだろうがコード量を減らせるのは魅力的なんで、引数を見て分岐する事にします。 後気をつける事といえば、ハッシュカット時のPVの扱いでしょうか。 TDLeaf(λ)をやってる関係…
http://xtreview.com/addcomment-id-4164-view-Bloomfield-will-cost-less-then-400-dollars.html ハイエンドデスクトップ向けのBloomfieldとミドルレンジ向けのLynnfieldではソケットが違うという話でしたが、今まではBloomfieldはCore 2 Extreme後継だけだ…
http://blog.bugyo.tk/lyrical/2008/02/post_43.html http://www.nicovideo.jp/watch/sm2197148(要アカウント) この前も話題にしたリリカル☆LispやPostScriptでLispの開発者の方が、今度はタイトルのものをやっちゃったそうです。 んで、対局してみました…