GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-08-01から1ヶ月間の記事一覧

昨晩の連続対戦の結果

どちらの勝率もほぼ60%だったので、エンバグしてるって事は無いはずです。 とりあえず、これで安心して使えますので、早速1秒モードに戻して連続対戦させてみます。

思考時間制御の改良中

今まではルートノードでしか残り時間をチェックしていなかったのを、内部ノード*1でもチェックするように修正。 …修正したのはいいんだけど、妙に弱くなってます。 単純に前のバージョンより思考時間が短くなっている*2のが原因なのか、それともバグなのか不…

新バージョンは期待出来る…かも

Lesserkaiと2戦させてみたんですが、序盤からちゃんと(?)金を*1敵陣に進めて攻めれてたんで、ひょっとしたら序盤の学習も上手く行ってるかもしれません。 前のバージョン(選手権の時の)だと、序盤は大駒だけで何とかしようとして結局どうにも出来ないっ…

将棋所をGUIとして使用する為に最低限必要なUSIコマンド

選手権の時に「将棋所を使いたいけど、コマンドが多いから…」って話を数人から聞いたので、私が実装した際に最低限必要だったコマンドを書いてみます。分からない事があれば、コメントなりメールなりで聞いてもらえれば、分かる範囲でお答えします。 注意 こ…

乱数有り無しでの対局結果

乱数有りの側から見て110-4-120で勝率47.8%。95%信頼区間は41.2-54.5%。 やや弱くなってる可能性はありますが、これ位なら許容範囲です。という訳で、乱数は昨晩の設定で行く事に決定。

評価関数に乱数を入れる

連続対戦用に、評価値に乱数を足すルーチンを作ってチョコチョコと調整。乱数が大きすぎても小さすぎてもいけないんで、少し気をつかってやってます。 んで、現在は乱数ありと無しの2つのエンジン(それ以外の、パラメータとかは全く同じ)で連続対戦中。こ…

しつこくUSI対応中

反復深化と簡単な思考時間制御を実装して、とりあえずそれなりの形にはなりました。 ちなみに新バージョンの強さは、Lesserkaiとやって2戦2勝。評価関数に乱数入れてないんで、まだ連続対戦出来ないです。 明日にでもサクッと乱数を追加して、とりあえず連続…

まだUSI対応中

infoコマンドでPVとか評価値とかを表示できるようにしました(キリッ まぁ、実際はほとんど作業してないんですけどね。

NVIDIAのDirectCompute対応ドライバ

http://pc.watch.impress.co.jp/docs/news/20090824_310402.html Windows 7用のDirectCompute対応ドライバで、多分今まではDirectX Compute Shaderと呼ばれていたものに対応。 要するにGPGPU対応ドライバで、ATIからもDirectCompute対応ドライバが出てくれば…

続々 USI対応中

今日やった事。 残り時間の取得に対応。 SFEN形式の局面指定に対応。 後は反復深化を実装して、PVとか評価値をGUIに送れば一通り形になりますね。もうちょっとです。

USI対応中(続)

局面を受け取って思考して指し手を返すのは完了。Lesserkaiと一局指して、ちゃんと投了する所までは出来ました。 まだ、思考時間の指定とかSFEN形式の局面指定とか色々出来てない所はあるんで、それは明日にでもやる事にします。# なんか、最近集中してコー…

USI対応中

初手で投了する所まで出来ました。後はひたすら思考して指し手を返すだけ(のはず)。

新バージョンを少し修正

今日の変更点は二つ。 一昨日の旧バージョンへの修正を、新バージョンにも反映 ソフトマックス方策での温度自動調整の方法を修正 二点目は、もともとは探査率*1の実際の値と目標値の関係を見て調整していたのを、探査回数ベースに変更。 三目並べやリバーシ…

Core i7 8x0 / i5 750は9/8販売開始らしい

http://www.gdm.or.jp/voices_index.htmlの8/19更新分 Core i7 9x0よりマザーが(多分)安くなって、メモリにかかるコストも減る(はず)なんで、コストパフォーマンス重視するなら狙い目かも。 あと、Turbo Boostでシングルスレッド時は大幅にクロックが上…

旧バージョンの方で少し手直し

静止探索のみや全幅1手+静止探索だと問題無かったんですが、全幅2手+静止探索だと変な現象(温度が異常に下がる)が起きてたんですけど、原因らしきのもが判明。評価値の浮動小数点がらみの演算の誤差が、巡り巡ってその現象を引き起こしていたみたいです。…

暫定掲示板開設

http://com-sho.bbs.fc2.com/ 色々考えた結果、ライブラリ関係の議論の出来る掲示板があってもいいんじゃないかと考えて作ってみました*1。 開発者・関係者・観戦者等問いませんので、ご自由に意見を書き込んで頂ければと思います。 *1:作ったというか、レン…

一昨日のコードの成果

終局図の重複チェックですが、最大重複数が1000局中10前後なんで、まだ予想よりは大分少ないです。 んで、今までの動きを見た感じだと、温度がまだ5桁ほど低くなる可能性があるので、そうなった時にどういう値になるかを待ちます。 本当はこの間に新バージョ…

ライブラリ制度に関する一意見

まず私の立場ですが、基本的に肯定派。ただし、安易なクローン乱立に関してだけは否定派です。 んで、何でクローンが乱立して欲しくないかと言うと、単に「自分が選手権に参加しても楽しくなくなりそうだから」。ただそれだけです。 別に、ここ数年自分がや…

ライブラリのアンケート

この辺のエントリで知って、ついさっき回答してきました。 http://www.computer-shogi.org/blog/solicit_opinions_about_library_rule/ http://www.sgtpepper.net/kaneko/diary/20090816.html アンケートに回答欄が無かったので書いてないんですが、私は基本…

終局図の重複を調べるコードを実装

と言っても、かなり簡略化してありますが。 まず、局面そのものではなく、終局時のハッシュコードの下位20ビットが、最新1000局中に何度現れたかをカウントしています。で、出現回数の最大値をログファイルに書き出す様にもしてあります。 こうすると、同じ…

そう言えばGPWまであと100日

今年も参加出来ないかなぁ・・・この分だと。 不況で金欠なんで参加費も旅費も用意出来そうにないし、後で論文読むだけで我慢しときます。

温度高めで開始したんですが…

一晩で2000局しか進んでません。あ、今ちょうど3000になった。 さすがに温度高めだとほとんどランダムに行動するんで、対局が終わるまで時間がかかってるみたいですね。後は探索時のウィンドウ設定にも温度が影響するんで、その辺も関係してるんでしょうけど…

三目並べ・リバーシ用にコード再修正

新バージョンのコードは、もともと三目もリバーシも動く様になってたんですが、将棋用に色々修正した*1結果、三目・リバーシ用のモードではコンパイル不可能になっていました。 そこで、今日は将棋固有の処理をちゃんと切り分けたり*2して、三目・リバーシで…

昨日の分

書き忘れてたけど、対局終了時の処理を小規模修正。 最後まで(合法手が無くなるまで)指す様に変更したのは問題無さそうなので、余分なコードは消してきちんと対応。だいぶスッキリしました。

動かしてみて足りなかった分追加

History Heuristicでオーダリング。 静止探索。 もうちょっとまともな評価項目。 ベンチマーク用のコード整備。 パラメータのセーブ・ロード。 情報収集の枠組みを作る。 方策内でのウィンドウ設定及びオーダリング。 必要ならHistory Heuristicの拡張。 千…