GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-01-01から1ヶ月間の記事一覧

キー入力環境

Visual C++ 2008 Express Editionをインストールしてみたんですが、私には理解出来ない原因でx64アプリが作成出来ませんでした。Emacsモードのコピペ関連のバグが修正されているらしいだけに残念です。 んで、XKeymacsというソフトの設定の方でコピペする様…

Windows 7の登場時期は来年後半の予定

http://blog.livedoor.jp/amd646464/archives/51137046.html となると実際は半年遅れて2010年半ばってあたりかな。 その時期になると「Windows 7は重い。Vistaは軽くて枯れてるから(ry」ってセリフをあちこちで聞く事になりそうw# てか、いつも新OS出る…

Intel Larrabeeの登場時期

http://blog.livedoor.jp/amd646464/archives/51137616.html 元は海外のニュースサイトですが、私は日本語記事しか読んでないんでそちらにリンク張ります。 んで、並列計算向けとかグラフィックカードにも使えるとか言われているLarrabeeですが、2008年終わ…

45nmのCore 2発売

大抵のニュースサイトで報じられてるんで、あえてリンクは張りません. んで、今回はCore 2 Quadは未発売なのですが、デュアルコアのE8500がちょいと気になります。 3.16GHzでデュアルコアなんで、並列化しない OR したけど効率低いって状況だと、低クロック…

最近思う事

おかしいのはGA将!!!じゃなくて私の頭なんじゃないかと。 いや、かなりマジで考えてます。

修正完了

とりあえず10分ほど動かしてもエラーは出てないんですが、長時間動かすと変になる可能性もあるので、今日はこのまま動かしてみます。 それから、オプティミスティック初期値を設定した強化学習で学習率を1.0にしたやつを開発用マシンで動かしてたんですが、…

取り合えず今日の予定

昨日書いた修正後の学習はまだ収束していない様子なので、今日はそのまま動かしつつ修正。 んで、評価関数のソースを読んでも大きなバグらしきものは発見出来なかったのですが、ちゃんと学習している評価項目と変な評価項目で使用しているデータに差があるの…

シゴフミ

アニメの2話を見るまで評価を保留してたんですが、なかなかイイですね。 やっぱりこういう黒くてドロドロした話もたまには見たくなります。 という訳で、今期はガンダム00・狼と香辛料・シゴフミの3つを視聴予定。 って、時間あるのか、そんなに?

オープン戦

2/9かぁ。間に合うかなぁ。 あと23日。何とかして飛び入りででも参加したいところです。

続・実験条件

書き忘れていましたが、学習率を下げるのはあんまり上手く行かなかったので、0.1〜0.0001までの4パターンでやってみます。

εを1.0〜0.001まで変化させた結果

あんまり進歩せず。 ログファイルをちゃんと見る気にはならないんで、とりあえず保存しといて後で見ます。 んでもって、まだ評価関数のソースを読み終わってないんで、その間に学習用マシンには別の実験をしてもらいます。 やるのは以前試したオプティミステ…

マザコン

マザーボード・コンプレックスの略称もマザコンになるのかなぁ、とかふと思いました。 なんか無性にPCを自作したい。時間が無いからこそ自作したい。 Mini-ITXとかでコンパクト・非力なマシンを自作して選手権に持ち込みたい。 ・・・いらん事考えてないで、…

εの変更方法

今は1.0から始めて徐々に小さくしていますが、これをちょっと変えようかとも考えています。 変更のルールは決め打ちで、勝ったら少し小さく、負けたら少し大きくする、という方法。 これだと、勝った後は同じ手を選択して無難に勝ちにいく、負けたらランダム…

一晩分

まだ3000局終わってません。あと半日はかかりそうなのでそのまま続行してみます。 まぁ、対局終了時の局面を見る限りでは、あまり期待出来なさげなのですが。 そういう訳で、今日は印刷した評価関数のソースをちゃんと読んでみます。

狼と香辛料

開発の息抜きに録画したヤツを見てたんですが、結構いいですね。 中世らしき時代設定で、なんか見ていて和みます。 あと、ヒロインが獣耳・スレンダー・偉そうな態度ってあたりがツボです。

バグはいまだ発見出来ず

一個上ですが、なんか地が出ちゃってました。いかんいかん、ちゃんと猫かぶっとかないと色々ヤバイです。 んで、今までの成果は表題の通り。成果ゼロ。 ただ、それだけだと時間が無駄になっちゃうんで、対局数を3000で打ち切りにして実験をリトライしてみま…

昨日の修正(ε可変)はハズレ

という訳で評価関数のバグの線が濃厚。 っつーか、ぜってーどっかバグってる。でなきゃどうしようもねーし。

εを可変に修正

1.0からはじめて、1000局経過するとに0.1倍になる様にしてみました。 リバーシだと上手く行ってたやり方ですが、はたして将棋ではどうなのか、と思って。これで当たればもうけもの、外れても全然痛くない賭けです。 あ、実際は1000局ごとに0.1倍するんではな…

どでかいバグ発見

私の頭の中に。 パラメータの読み方間違ってました。 そう考えて見てみると一部(金の相対位置とか)はまともでした。それなりに。 ん、て事は、今悩んでる問題(囲ってくれない)の原因はいずこ?

一晩分

学習中の先手の勝率を表示させているのですが、学習率0.0001だと21%、それより下だと2〜3%と、明らかに低すぎる数値です。 ちなみに0.001だと42%。まぁ許容範囲かな、という所です。 んで、原因。バグの可能性もありますがそれ以外で。 おそらくε*1を固定し…

開発日記の予定と一本化

というか、別々に管理してちゃTODOの意味ナシだと今更気付いた。 んでもって優先順位を色々いじくる。まずはちゃんと学習させて、細かい事はその後。 将棋関連 デバッグ 将棋用の評価関数の実装 駒割 絶対位置による評価 王将との相対位置による評価 王将の…

Nehalemファミリのキャッシュ構成

Lynnfieldの綴りを確認する為にググってたら、以前のPC Watchの記事を発見。 で、“Nehalemファミリの内部構造”という図でちょっと気になる事に気付きました。 Xeon MP後継のNehalem-EX(Beckton)は2コアで共有する*1キャッシュ+全コア共有のLast Level Cac…

Penrynファミリの地味な改良点

http://microboy.seesaa.net/article/78436898.htmlより。 2.高速なOS同期用Privmitiveのsupport OSの同期処理に関係する処理を高速化したらしい。以下の3項目が挙げられる。 Lock Prefix付きの命令が高速化 OSがmulti-thread処理の同期操作に使うlock prefi…

並列化を忘れてた

ちゃんとUSI対応 学習ルーチンの仕上げ 学習ルーチンの並列化 学習させる(2〜3ヶ月は必要?) デバッグ チューニング 4ヶ月で終わるのか、これ?

冷静に考えてみると時間が無い

あと4ヶ月でやらなきゃならない事。 ちゃんとUSI対応 学習ルーチンの仕上げ 学習させる(2〜3ヶ月は必要?) デバッグ チューニング マジやばいです。

約三日分

評価関数修正後に学習率を0.1,0.05,0.01,0.005の4パターン走らせてたんですが、パラメータをよく見てみるとどれも変に学習していました。 具体的に書くと、駒割や王将の移動範囲はそこそこまともなんですが、絶対位置や相対位置のパラメータは変になっている…

Phenom 9900・9700は第2四半期に

http://japan.cnet.com/news/ent/story/0,2000056022,20364693,00.htm 3コアのバージョンを優先するらしいですから、4コアの歩止まりが悪いという事なんでしょうか。 で、4月に出るなら選手権にぎりぎり間に合いますが、どうなんでしょうねぇ。頑張って欲し…

将棋所のサポート掲示板が開設されました

1/8のコメント欄で教えてもらったのですが、掲示板が開設されたそうです。URLはこちら。 http://www2.ezbbs.net/09/shogidokoro/

予定変更、入玉等の実装について考える

正確に書くと、入玉・千日手・連続王手の千日手・打ち歩詰めの対処。けど長いんで“入玉等”と書きます。 本当は王将周辺の利きの評価をいじる予定だったんですが、時間がかかりそう&頭が入玉モードになっているので。 まず、局面クラスは過去の局面の履歴を…

αβ+PV保存ルーチン

http://d.hatena.ne.jp/Gasyou/comment?date=20080108#cで将棋所の作者さんから質問があった件で、TDLeaf(λ)をやってる人にも有用そうな情報なので、αβでの先読みにPV*1保存機能を追加したバージョンをアップ。 ざっくり説明すると、AlphaBetaSearcherという…