GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2018-05-01から1ヶ月間の記事一覧

カルマンフィルタを用いた強化学習

Kalman Temporal Differencesという、TD法とカルマンフィルタを組み合わせた手法は存在する様なのですが、方策勾配法でも同様の事が出来ないかと検討中。カルマンフィルタの基礎作者: 足立修一,丸田一郎出版社/メーカー: 東京電機大学出版局発売日: 2012/10/…

Ver.10の表記は「GA将?」とします

ちゃんと書かずにブログタイトルとTwitterアカウント名だけ変更していましたが、GA将 Ver.10は「GA将?」に決めました。 '?'一個で'!'10個分という表記法としますので、Ver.11は「GA将!?」になる予定です。鬼が笑い死にする再来年の話ですが。

選手権で見えた課題とその対策

まず、課題。 駒割を重視しすぎて指し手がヌルい。 圧倒的な学習時間(≒対局数)不足。 テキトー過ぎる思考時間制御。 1.に関しては「15年前の評価関数だね」という感じの有り難い助言を頂きました。本当にその通りで、ここは改善の余地ありです。 2.ですが…

GA将!!!!!!!!!の選手権は終了しました&ライブラリ制度に関して思う所

先程帰宅し、GA将!!!!!!!!!の第28回世界コンピュータ将棋選手権は無事終了しました。 一昨日・昨日は非常に有意義な時間を過ごす事が出来ました。主催者並びに関係者・参加者の皆様に感謝いたします。 結果はこちらから確認出来ますが、GA将!!!!!!!!!は4勝4…