2007-11-01から1ヶ月間の記事一覧
http://pc.watch.impress.co.jp/docs/2007/1119/amd.htm http://www.gdm.or.jp/voices.html とりあえず2.3GHzと2.2GHzの9600・9500のみ。9500の発売解禁は22日予定。 おまけに9600は来年までお預け。それより先に2.4GHzの9700(予価¥36,000)が発売になる予…
出ました。 19:12:40 @ Kyokumen::getApplicableTeArray() > ステイルメイト 最後の手=+(0,0)->(1,3)^歩 +---+---+---+---+---+---+---+---+---+ | | | | | | | | |v王| +---+---+---+---+---+---+---+---+---+ | | | | | |^歩| | | | +---+---+---+---+---+…
評価関数の出す値が-1から1になるはずがどうも変な値を出してると思ったら、学習率やλが影響していたみたいでした。 元々0.1と0.99だったのを、学習率だけ0.01にしたりλも0.7にしてみたらOKになりました。 結構色々と強化学習関連の経験値が不足している感じ…
2GBあっても足りない。 だって、Vistaで常駐アプリがゴテゴテ動いてるから。 だから、たった500MB程度のテキストファイルを開いただけでメモリが足りない。 給料入ったら2GBモジュール買おう。2枚。 もしくは4枚買って計8GBに。激しく無駄ですが。
とりあえずバグは取れました。けど、原因がさっぱり不明。 まず、クラスAにstaticな__int64型の変数があって、これはクラスAの特定のメソッドを呼ぶたびにインクリメントする。 で、それとは別にクラスBにstaticなintの配列があって、Aの変数をインクリメン…
後手の龍だけデータが変になるのは嫌がらせですかそうですか。 ・・・自分で仕込んだバグですね。
ニコニコしようとするとバグる (. .)φメモメモ
領域破壊で99%確定。 さて、原因探らないと。# つーか、原因分かると一気に気が楽になりますね。
http://pc.watch.impress.co.jp/docs/2007/1115/amd.htm GeForce 8800 GTとガチンコ対決になるんでしょうが、どっちも急いで欲しいもんではないのでスルーの方向で。 つか、コンピュータ将棋がマジでピンチ。選手権に間に合わんかも。
私の頭でした。配列のサイズを1小さく確保してた _| ̄|○ ちょっと樹海に逝ってきます。
なんか、すっげー嫌な響き。
根本的な原因は後手の龍の利き情報が正しく設定されてなかった事みたいです。 で、そっから王手がかかってるのに王将が逃げない→王将を取る→評価関数内部でバグる、って連鎖してたみたいです。 じゃぁ何で龍の利きが変なのか、とか、何でリリースモードでだ…
評価関数のパラメータを0で初期化していたのを、±0.0005位の乱数に変更。 あ、±0.005だったっけ? まぁ、絶対値にはあまり意味が無いです。要は適度にいろんな手を試す様な初期値にした、ってだけ。 他の部分、特に昨日書いたReleaseモードでのバグは手付か…
調子に乗ってReleaseモードでコンパイルしたら、学習3〜4局目で落ちます _| ̄|○ 今日はもう寝て、明日やりましょう。
GPW参加中の土曜夜〜日曜朝に徹夜して、昨日の夜は早めに寝たんですが、それでもまだ眠いっす。 学習開始前にプロセスの優先度を下げる 学習高速化の為、学習率を0.01→0.1、λ*1を0.8→0.99に 以上二点、所要時間1分。 では、おやすみなさい。 *1:後の局面のTD…
約3500局のうち600局ほどがステイルメイトで終局していました。 実際の局面はこんな感じ。 20:03:15 @ Kyokumen::getApplicableTeArray() > ステイルメイト 最後の手=-(1,8)->(1,7)vと +---+---+---+---+---+---+---+---+---+ |v香|v桂|v銀|v桂| | | | |v香|…
http://plusd.itmedia.co.jp/pcuser/articles/0711/12/news065.html 秋葉原にPhenomのポスターが掲載されたそうです。ただ、時期に関してはまだ正式な発表は無い様です。 で、個人的に欲しいのは記事中にあるPhenom X4のダイを使ったキーホルダー。欲しいっ…
http://pc.watch.impress.co.jp/docs/2007/1112/intel.htm 最高性能のものを抜き出すと、Core 2 Extreme QX9650(3GHz・クアドコア)とXeon 5482(3.2GHz・クアドコア)の二つですね。 私はこの世代はスルーする予定ですが、今から選手権用マシンを買う予定…
http://d.hatena.ne.jp/tihara/20071111#p1でボナンザVS勝負脳に関する話が載っていました。自動音声認識でのここ20年ほどの状況とコンピュータ将棋の現状を比較しての記事で、最後ではgoogleに関しても触れられています。 内容は前半で機械学習やコンピュー…
19:39:16 @ null::main() > 101局終了時の局面 +---+---+---+---+---+---+---+---+---+ | | | | | |^金| | |v香| +---+---+---+---+---+---+---+---+---+ | | | |^飛| | | | | | +---+---+---+---+---+---+---+---+---+ | |v歩| | | |v歩|^桂|^銀| | +---+--…
将棋関連 将棋用の評価関数の実装 駒割 絶対位置による評価 王将との相対位置による評価 ← 結局実装した 二駒の位置関係 王将の動ける範囲 王将周辺の利きの数 将棋で使う為に強化学習関連のクラスをC++に移植 ← いまここ 将棋のルールの細かい部分の実装 千…
途中でエラーが出て落ちてましたが、ある程度進んでたので良しとします。 んで、終了局面。 3:13:20 @ null::main() > 473局終了時の局面 +---+---+---+---+---+---+---+---+---+ |v香|v桂| |v金|v王| | |v桂|v香| +---+---+---+---+---+---+---+---+---+ | …
小宮さんはモンテカルロ・UCTに注目されていましたが、私は強化学習も結構件数があったな、という感想です。 ただ、内容は成功したりしなかったりという感じでしたね*1。 まぁ、将棋や囲碁みたいにプロ棋士の棋譜があるゲームで強化学習をするのは、ある意味…
昨日の夜は徹夜したから眠いっす。電車のなかで寝ますか。 - sent from W-ZERO3
ついビールを飲みたくなるのが困りものです。グチっててもしゃーないんで駅弁。
23:54:37 @ null::main() > 0局終了時の局面 +---+---+---+---+---+---+---+---+---+ | |v桂| | | | | |^杏|^金| +---+---+---+---+---+---+---+---+---+ | |v銀|v金| |v王| | |^と| | +---+---+---+---+---+---+---+---+---+ |v香|v歩|v歩|v歩| | |^全| |^…
強化学習将棋がとりあえず動きました。記念すべき初対局の終了図。 23:28:49 @ null::main() > 0局終了時の局面 +---+---+---+---+---+---+---+---+---+ | |v桂|v王|^と| | |^と|^金| | +---+---+---+---+---+---+---+---+---+ |v香| | | |^圭| |^全|^歩|^金…
もう時間が無いから寝る がんばって将棋の強化学習を動かしてみる とりあえずGPWの荷造りしながら考えます。
テステス - sent from W-ZERO3
けど、ちゃんと学習していない雰囲気。あくまでエラーが出ないだけ。 もうちょっと進めて、今日中に将棋で動かしたいなぁ。