GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2011-09-12から1日間の記事一覧

進行度の計算方法

を調べてるんですが、特徴のとり方は大体把握出来たけど、肝心の計算方法がさっぱり。私の探し方が悪いのかなぁ… まぁ、簡易版Bonanza Methodやってた時に集めた棋譜が大量にあるから、それを教師にして適当に学習させればそれなりの進行度計算ルーチンにな…

新人さんのブログ発見

http://d.hatena.ne.jp/hiyokoshogi/ “ひよこ将棋”というソフトの開発者さんの様です。今年8月23日にブログ開設だから、3週間ほど気付かなかったって事になりますね(いつもはRSSリーダがこういう情報を拾ってきてくれるのですが…)。 どうやらモンテカルロ…

肝心なの忘れてたんで追加

&優先度を色々変更。 シグモイド関数無しでの方策勾配法 実装は完了。現在テスト中。 レポート収集系の整理 パラメータのセーブ・ロードまわりのテスト ※問題無し NumericVectorクラスの高速化(プロファイルとって、学習が高速化出来そうなら着手) ※遅く…

よしよし、イイ感じ

上で書いた結果は諸事情によりソフトマックス方策の初期温度低めで開始してたんですが、本番の学習と同じ様に温度高めで開始しても、それなりに王将周りに駒を集める様になりました。 2610局終了 +---+---+---+---+---+---+---+---+---+ | | | | | | | | | |…

囲ってるつもり?

昨夜から走らせていた、対局開始から50手だけを学習対象とするバージョンですが、「王将の周りに駒を集めれば勝ちやすい」位は理解したみたいです。 終局図は例えばこんな感じになります。 8260局終了 +---+---+---+---+---+---+---+---+---+ | | | |^と| | …