GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-01-28から1日間の記事一覧

やばいやばい

修正してコンパイルまではしたんだけど、学習を実行しておくのを忘れてました。 忘れたままだと学習用マシンが一日遊ぶ事になるんで、スケジュールを考えるとやばいところでした。

今日やった分を反映

将棋関連 デバッグ 将棋用の評価関数の実装 駒割 絶対位置による評価 王将との相対位置による評価 王将の動ける範囲 王将周辺の利きの数 二駒の位置関係 反転パターンに対処したら有効にする 将棋で使う為に強化学習関連のクラスをC++に移植 TDLeaf(λ) αβの…

王将周辺の利きの評価を修正

先後共通のパラメータを増やして、例えば先手の玉頭*1と後手の玉頭*2のパラメータを共通にしました。 つーか、何で最初からそうしないんだって話ですね。うぃ、手抜きが過ぎました。 んで、修正したんでリコンパイルして王将周辺の利きの評価を有効に。見る…

悩んでてもどうにもならないし

とりあえず積み残しだった王将周辺の利きの修正をします。 それが終わったら上手く行く可能性・・・は低いよなぁ・・・・・

二日分。訳分からん。

id:streakeagle:20080126:1201351787で書いた駒割の修正をした結果。 結局学習率0.001がベストっぽいというのは変わらないものの、結果をどう見るべきか迷っています。 まず、駒割はちゃんと学習出来ました。 よって、「駒割や王将移動範囲の評価で使ってい…

USB接続の8インチモニタ

http://www.watch.impress.co.jp/akiba/hotline/20080126/etc_spf83h.html って事は、Wireless USBと組み合わせれば“ワイヤレスUSBモニタ”が実現可能、と。 選手権でログ表示のウィンドウだけ持ち歩きたい、とかって用途に使えそうですね。 ただ、電源がACア…

Radeon HD 3870 X2

http://pc.watch.impress.co.jp/docs/2008/0128/amd.htm AMDってホントにX2が好きなんですね。とかは置いといて。 型番から分かる様に、3870が2つ載ってるカードらしいです。 Athlon 64と64 X2みたいな関係? ちょっと違いますか。 欲しいなぁ・・・誰か私…

PSプリンタで動くLisp

http://blog.bugyo.tk/lyrical/2008/01/_lisp.html 以前書いた(様な気がする)リリカル☆Lispの開発者の方が、PostScriptプリンタで動くLispなんつーものを開発しちゃったそうです。 という訳で、誰か選手権にプリンタで参戦して下さい。言語はもちろんLisp…

UCBとGAを組み合わせた方策による、探索を制御するパラメータの学習

自己対戦による強化学習を前提とします。 評価関数のパラメータはTDLeaf(λ)等のアルゴリズムで学習出来ますが、αβ法での探索を制御するパラメータ*1は微分が難しい*2ので、どうやって学習させればいいか決めかねていました。 で、以下の様な流れで学習できな…

モンテカルロ法を用いた5五将棋システム

http://ci.nii.ac.jp/naid/110006345248/ HIT将棋さんの研究室でやっていたみたいですね。ついさっき知りました。 ゲーム情報学研究会に準会員登録してあるからPDFの閲覧出来そうですし、明日にでもユーザ登録してみます。 となると、やはり小宮さんの「猛将…