2010-02-01から1ヶ月間の記事一覧
探索深さによって変わる模様。0だと6〜7で、1にしたら3前後まで行った(一棋譜での結果)。
変更点。 評価項目で二駒絶対と王将周辺の利きは挙動が怪しいので外した。 簡易版ボナメソで学習後、パラメータ引継ぎでTDLeaf(λ)の順に戻す。 TDLeaf(λ)では探索を全幅2手+静止探索に変更。 色々試行錯誤中ですが、これだとどうかな? って感じで色々やって…
簡易版ボナメソで学習させたパラメータを持ち越して学習させてみても、でたらめな手しか指さない。 んで、方策をソフトマックスからεグリーディーに変えるとちゃんと指してるので、ソフトマックス方策がおかしい模様。 とりあえず仮の対処としてεグリーディ…
http://nueda.main.jp/blog/archives/004880.html 発売がいつになるかは分かりませんが、ひょっとしたらギリギリ選手権に間に合うかも。
当面は高速化よりもちゃんと動かす事を優先してみます。 とりあえず簡易版ボナメソ部分の学習率を少し上げたバージョンを学習用マシンに投入。
今まではisreadyが来てから生成してたんですが、パラメータロードに時間がかかってfloodgateでサーバタイムアウトになってたんで、usiokを返したらすぐに変更。 対局相手の皆様、さんざん対局を止めちゃっててすいません。
http://www.gdm.or.jp/voices_html/201002/2301.html 当初はバルクのみの出荷だそうで、ひょっとしたら入手性に難があるかもしれません。 まぁ、選手権で使う人はマシン一台ごと買ったりって手もあるんで、(お金さえあれば)そんなに問題無いのかも。
http://524.teacup.com/yss/bbs/1646 コンピュータ将棋や囲碁の掲示板で紹介されていた本ですが、アマゾンで注文しました。ゲーム計算メカニズム (コンピュータ数学シリーズ 7)作者: 岸本章宏,柴原一友,鈴木豪,小谷善行出版社/メーカー: コロナ社発売日: 201…
とりあえず評価関数をちゃんとしてから探索をいじる事にしました。あと、ABC探索は私にはまだ早いかも。 んで、二駒絶対位置関係の評価の差分計算がバグっていたのを修正…出来ませんでした。バグの原因らしきものは見当付いたんですが、肝心の対策がまだ。 …
探索の延長・短縮や実現確率探索とかは自分には向いてない気がするんで、ABC探索を頑張ってみようと思って昨日から実装中。 …なんですが、全然深く読めません。序盤で4手読みとか、全幅探索より悪化してます。 どっか根本的に間違ってる気がするんで、McAlle…
http://www.geocities.jp/shogi_depot/ ソフト名は「ボン多」と言うそうです。プチ将棋やfloodgate観戦室の作者の人の作品。 マニュアルを見てみましたが、結構簡単に使えそうです。 …が、GA将!!!!の対局相手としてはボナンザ3手読みですら強すぎるので、ス…
昨日floodgateに投入したバージョンですが、対sspは158-3-182で勝率45.0%、95%信頼区間は41.1〜51.9。 意外と伸びませんでした。残念。
簡易版ボナメソの探索を静止探索4手のみに変更 簡易版ボナメソの学習率をさらに1/30に減少 24の棋譜に変更 ひょっとしたら、最後に簡易版ボナメソで学習した棋譜がパラメータに大きな影響を与えているんじゃないかと思い、その辺修正。
簡易版ボナメソ部分の学習率を低めにしたら上手く行ってる感じなので、ここらでfloodgateに投入。 なんか、四間飛車大好き&苦手になったみたいですが、勝てるのか、これで? ちなみにssp相手の連続対戦は現在28-0-24で勝ち越し中。一晩走らせてみて、順調そ…
序盤〜中盤の位置評価が過剰に学習されているっぽいんで、その部分の学習率を0.3倍に変更。 他はそのままでパラメータ持ち越しで学習にリトライしてみます。
154-6-157で勝率49.5%。95%信頼区間は43.8〜55.2。 まぁ、残念だけどこんなもんですか。 今夜は約17万局学習後のバージョンで連続対戦させてみます。
簡易版ボナメソ+自己対戦のパラメータがそこそこ強くなってるみたいなので、floodgateに投入。22:00の回からです。 まぁ、まだまだ学習途中なので色々荒削りですし、floodgateでは負けまくると思いますが。 ssp相手の連続対戦は今のところ16-0-16。正確な勝…
どうやら当たりだった様です。ボナンザの自己対戦棋譜約3000局で学習して、一致率が40%前半、平均順位が3〜4になりました。以前はそれぞれ30%代・6前後だったので、大幅に伸びています。 学習用マシンで走らせていたプログラム(簡易版ボナメソ+自己対戦…
http://gigazine.net/index.php?/news/comments/20100216_k-on2/ !が増えてくのはGA将!!!!と同じ〜 わーいパチパチ
今までは簡易版ボナメソとTDLeaf(λ)を別々に動かしていたのですが、それだとどうも上手く行かないので、同時に走らせる様に修正。 学習用マシンがCore i7で8スレッド並行なので、簡易版ボナメソ1スレッド+TDLeaf(λ)7スレッド。 上手く行けばボナメソの序盤…
Atomマシンやらなのは関連の諸々の出費やらが積み重なって、ちょっと額がすごい事に。 …今月は週末に酒飲むのも自重せにゃならんかな、これは。
読み GA将!!!!は「がしょう」と読みます。 初期バージョンでGA(遺伝的アルゴリズム)を用いた学習を行っていたのが名前の由来です。 概要 簡易版ボナンザメソッドと強化学習のハイブリッド構成の学習ルーチンで評価関数のパラメータ調整を行うソフト。 学習…
簡易版ボナメソバージョンが意外とちゃんとした将棋を指すんで、選手権にはこのまま出てもいいかな、とか思ったり。 まぁ、あと2ヶ月ちょいあるんで、ギリギリまで強化学習で粘ってみますが。 あ、でも、今のパラメータを保存しとくのは忘れない様にしないと…
http://k-tai.impress.co.jp/docs/event/mwc2010/20100216_349281.html …なんだけど、あんまり惹かれるものはないですね。 正直、私がスマートフォンで日常的に使ってるのはブラウザと予定表だけなんで、OSがカッコよくなってもあんまり…って気はします。 ま…
http://pc.watch.impress.co.jp/docs/column/kaigai/20100216_349232.html 省電力機能の解説の他、コア間での情報のやりとりに関しても情報があります。 コア数が増えるとキャッシュコヒーレンシの負荷が大きくなるので、このチップや(おそらく)将来のLarr…
185-1-106で勝率63.6%、95%信頼区間は57.8〜69.1。 まぁ強くなってるんですが、見てると全然囲わなくなってます。困った。
対sspで178-1-150。勝率54.3%で95%信頼区間は48.7〜59.8。まぁまぁ強くなってます。 今手元にもう一晩余分に自己対戦したのがありますので、今夜はそっちのパラメータで自己対戦させてみます。
下準備を終えていざチューニング、ってところで、根本的な見落としに気づく。結局ほとんど高速化出来ず。 そんな感じで今日はグダグダして終わる。明日こそは、明日こそはちゃんとなんか成果出したい。
現在4連敗中。とりあえず一晩様子見ます。 学習用マシンではパラメータ引継ぎで自己対戦学習を開始。今のパラメータをベースに強くなってくれれば、ってとこですが、果たしてどうなるのか。
多少は囲おうという気が見て取れたり、金銀をじっくり進めたり(活用してないけど)しているあたり、ちょっと期待出来そうです。 んで、これをベースに自己対戦で学習させてみようと思います。予定とは違うけど。 V2.1 N+Gasyou4 N-Lesserkai 1.3.3 P1-KY-KE…