GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-11-01から1ヶ月間の記事一覧

Phenom発表、だが・・・

http://pc.watch.impress.co.jp/docs/2007/1119/amd.htm http://www.gdm.or.jp/voices.html とりあえず2.3GHzと2.2GHzの9600・9500のみ。9500の発売解禁は22日予定。 おまけに9600は来年までお預け。それより先に2.4GHzの9700(予価¥36,000)が発売になる予…

打ち歩ステイルメイト

出ました。 19:12:40 @ Kyokumen::getApplicableTeArray() > ステイルメイト 最後の手=+(0,0)->(1,3)^歩 +---+---+---+---+---+---+---+---+---+ | | | | | | | | |v王| +---+---+---+---+---+---+---+---+---+ | | | | | |^歩| | | | +---+---+---+---+---+…

細々色々調整中

評価関数の出す値が-1から1になるはずがどうも変な値を出してると思ったら、学習率やλが影響していたみたいでした。 元々0.1と0.99だったのを、学習率だけ0.01にしたりλも0.7にしてみたらOKになりました。 結構色々と強化学習関連の経験値が不足している感じ…

メモリが足りない

2GBあっても足りない。 だって、Vistaで常駐アプリがゴテゴテ動いてるから。 だから、たった500MB程度のテキストファイルを開いただけでメモリが足りない。 給料入ったら2GBモジュール買おう。2枚。 もしくは4枚買って計8GBに。激しく無駄ですが。

訳分からん

とりあえずバグは取れました。けど、原因がさっぱり不明。 まず、クラスAにstaticな__int64型の変数があって、これはクラスAの特定のメソッドを呼ぶたびにインクリメントする。 で、それとは別にクラスBにstaticなintの配列があって、Aの変数をインクリメン…

だいぶ原因が絞り込めてきましたが

後手の龍だけデータが変になるのは嫌がらせですかそうですか。 ・・・自分で仕込んだバグですね。

最近よくある事

ニコニコしようとするとバグる (. .)φメモメモ

Releaseモードで落ちるバグの件

領域破壊で99%確定。 さて、原因探らないと。# つーか、原因分かると一気に気が楽になりますね。

Radeon 3800発表&発売

http://pc.watch.impress.co.jp/docs/2007/1115/amd.htm GeForce 8800 GTとガチンコ対決になるんでしょうが、どっちも急いで欲しいもんではないのでスルーの方向で。 つか、コンピュータ将棋がマジでピンチ。選手権に間に合わんかも。

バグってたのは

私の頭でした。配列のサイズを1小さく確保してた _| ̄|○ ちょっと樹海に逝ってきます。

どろり濃厚 虫の味

なんか、すっげー嫌な響き。

Releaseモードで落ちるバグ

根本的な原因は後手の龍の利き情報が正しく設定されてなかった事みたいです。 で、そっから王手がかかってるのに王将が逃げない→王将を取る→評価関数内部でバグる、って連鎖してたみたいです。 じゃぁ何で龍の利きが変なのか、とか、何でリリースモードでだ…

少しだけ修正

評価関数のパラメータを0で初期化していたのを、±0.0005位の乱数に変更。 あ、±0.005だったっけ? まぁ、絶対値にはあまり意味が無いです。要は適度にいろんな手を試す様な初期値にした、ってだけ。 他の部分、特に昨日書いたReleaseモードでのバグは手付か…

まだ起きてます(汗

調子に乗ってReleaseモードでコンパイルしたら、学習3〜4局目で落ちます _| ̄|○ 今日はもう寝て、明日やりましょう。

眠いので少なめ

GPW参加中の土曜夜〜日曜朝に徹夜して、昨日の夜は早めに寝たんですが、それでもまだ眠いっす。 学習開始前にプロセスの優先度を下げる 学習高速化の為、学習率を0.01→0.1、λ*1を0.8→0.99に 以上二点、所要時間1分。 では、おやすみなさい。 *1:後の局面のTD…

ステイルメイトは結構起こる

約3500局のうち600局ほどがステイルメイトで終局していました。 実際の局面はこんな感じ。 20:03:15 @ Kyokumen::getApplicableTeArray() > ステイルメイト 最後の手=-(1,8)->(1,7)vと +---+---+---+---+---+---+---+---+---+ |v香|v桂|v銀|v桂| | | | |v香|…

Phenom発売間近?

http://plusd.itmedia.co.jp/pcuser/articles/0711/12/news065.html 秋葉原にPhenomのポスターが掲載されたそうです。ただ、時期に関してはまだ正式な発表は無い様です。 で、個人的に欲しいのは記事中にあるPhenom X4のダイを使ったキーホルダー。欲しいっ…

45nmプロセスのCore 2 Extreme・Xeon 54xx発表

http://pc.watch.impress.co.jp/docs/2007/1112/intel.htm 最高性能のものを抜き出すと、Core 2 Extreme QX9650(3GHz・クアドコア)とXeon 5482(3.2GHz・クアドコア)の二つですね。 私はこの世代はスルーする予定ですが、今から選手権用マシンを買う予定…

http://d.hatena.ne.jp/tihara/20071111#p1でボナンザVS勝負脳に関する話が載っていました。自動音声認識でのここ20年ほどの状況とコンピュータ将棋の現状を比較しての記事で、最後ではgoogleに関しても触れられています。 内容は前半で機械学習やコンピュー…

リスタート後の局面

19:39:16 @ null::main() > 101局終了時の局面 +---+---+---+---+---+---+---+---+---+ | | | | | |^金| | |v香| +---+---+---+---+---+---+---+---+---+ | | | |^飛| | | | | | +---+---+---+---+---+---+---+---+---+ | |v歩| | | |v歩|^桂|^銀| | +---+--…

細々したのがどんどん増える・・・

将棋関連 将棋用の評価関数の実装 駒割 絶対位置による評価 王将との相対位置による評価 ← 結局実装した 二駒の位置関係 王将の動ける範囲 王将周辺の利きの数 将棋で使う為に強化学習関連のクラスをC++に移植 ← いまここ 将棋のルールの細かい部分の実装 千…

とりあえず400局ちょいは動いていました

途中でエラーが出て落ちてましたが、ある程度進んでたので良しとします。 んで、終了局面。 3:13:20 @ null::main() > 473局終了時の局面 +---+---+---+---+---+---+---+---+---+ |v香|v桂| |v金|v王| | |v桂|v香| +---+---+---+---+---+---+---+---+---+ | …

GPW感想

小宮さんはモンテカルロ・UCTに注目されていましたが、私は強化学習も結構件数があったな、という感想です。 ただ、内容は成功したりしなかったりという感じでしたね*1。 まぁ、将棋や囲碁みたいにプロ棋士の棋譜があるゲームで強化学習をするのは、ある意味…

GPW終了

昨日の夜は徹夜したから眠いっす。電車のなかで寝ますか。 - sent from W-ZERO3

新幹線に乗りました

ついビールを飲みたくなるのが困りものです。グチっててもしゃーないんで駅弁。

も一つ局面図投下

23:54:37 @ null::main() > 0局終了時の局面 +---+---+---+---+---+---+---+---+---+ | |v桂| | | | | |^杏|^金| +---+---+---+---+---+---+---+---+---+ | |v銀|v金| |v王| | |^と| | +---+---+---+---+---+---+---+---+---+ |v香|v歩|v歩|v歩| | |^全| |^…

やっちゃったZE

強化学習将棋がとりあえず動きました。記念すべき初対局の終了図。 23:28:49 @ null::main() > 0局終了時の局面 +---+---+---+---+---+---+---+---+---+ | |v桂|v王|^と| | |^と|^金| | +---+---+---+---+---+---+---+---+---+ |v香| | | |^圭| |^全|^歩|^金…

どうするか、うーん・・・

もう時間が無いから寝る がんばって将棋の強化学習を動かしてみる とりあえずGPWの荷造りしながら考えます。

携帯からの投稿テスト

テステス - sent from W-ZERO3

C++で三目並べの強化学習は動く

けど、ちゃんと学習していない雰囲気。あくまでエラーが出ないだけ。 もうちょっと進めて、今日中に将棋で動かしたいなぁ。