GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-05-01から1ヶ月間の記事一覧

棋譜通り指す方策は失敗

以前に作って動かしてた事はあったんですが、その時は例の「打ち歩詰めのバグ*1」があったんで、直した状態でリトライ。 …失敗しました。まぁ、別にそれならそれで良いんですが。 さて、そうすると今度はどうしようか。とりあえず探索を全幅2手+静止探索で…

予備実験を忘れてたんで追加

予備実験。 UCTで序盤を指すと、どの程度の手数まで進めれるか調査。 探索を全幅2手+静止探索にしてVer.3のコードを動かしてみる。 一からコードを書き直す。 三目並べ・リバーシ・将棋を一つの強化学習エージェントで学習可能にする。 評価関数は差分計算…

順調に遅れてます

体調不良を良い訳にしてグダグダと進行中。 んで、ソフトマックス方策は一時置いといて、勝率の検定とかのやり方を勉強&サンプルコードを書いたりしてました。 現状では、自作のコードで計算した95%信頼区間がakiさんの勝率計算機とかここのサイト*1とかの…

ボルツマン分布での手選択を実装

ソフトマックス方策*1の下準備としてボルツマン分布の部分を実装。と言っても、ほぼ前バージョンと同じルーチンです。 明日にはソフトマックスは実装完了の予定。もう、ほとんど出来たも同然です。 (あ、上の「出来たも同然」はソフトマックスの事で、将棋…

色々と思う事を

まずは選手権お疲れ様でした。運営&参加者の皆様、ありがとうございました。 Blunderのakiさんとこでは選手権の時に聞いた思考時間の学習の件を公開されていたので、早速読ませて貰います。 色々教えて貰ったおかえしに私も何かしたいのですが、現状では弱…

来年に向けて開発中

最初は決勝の中継を見ながらやってたんですが、それだと集中出来ないので途中からは見ずにやってました。おかげで波乱があったらしいのは見逃しましたが(汗 んで、開発はまだ序盤。メルセンヌ・ツイスタの乱数*1を実装したりとか、自前の配列風クラスの派生…

改めて優先度順に並び替え

色々考えた結果、合議制は後回しに。まずは単独の評価関数での精度を優先させます。 速度の目標は、前も書きましたが二駒の絶対位置関係まで実装した状態で1日100万局。三駒を実装したらもっと遅くなるでしょうけど、それでも10万は行きたいです。 それから…

今日の見学はキャンセル

微妙に体調が悪いので、他の人に風邪とかうつさない様にしておこうとおもいまして。 明日は元々見学無しの予定だったので、これで帰宅です。みなさん来年またお会いしましょう。

一次予選終了

GA将!!!は3勝4敗(うち1勝は相手の時間切れなので、実質2勝4敗1不明)で予選敗退。 本番の大分前から次期バージョンの開発に本腰を入れるという、どう考えても方向性がおかしな事をやってたんで、これは順当な結果でしょう。来年はちゃんとやります(反省)…

とりあえず宿にたどり着きました

今日の行動履歴。 8:00 家を出発。 9:30〜16:00 高速バスで名古屋〜新宿 17:30〜19:00 会場で接続テスト 19:30頃〜 かず@なのはさんと夕食 んで、今宿の部屋でゆっくりしてるところです。 とんこつラーメン食べてスタミナ回復したんで、明日に向けてゆっく…

選手権終わったらやりたい事

カブロボに手を出すのはやめて、当分コンピュータ将棋に集中します。 一からコードを書き直す(現在も進行中) 三目並べ・リバーシ・将棋を一つの強化学習エージェントで学習可能にする 評価関数は差分計算を基本にする 評価項目の追加 二駒の絶対位置関係 …

明日は東京に移動の予定

今年はノートPCで参加なので、荷造りとかは楽に済みました。 明日は移動してホテルにチェックインしてから接続テストに行く予定。 前回参加時の一昨年は割と直前までドタバタしてましたが、今年はそういう事も無く、のんびりやってます。まぁ、現在のバージ…