GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2016-11-01から1ヶ月間の記事一覧

ファミコンのソフトと対局してみた

ちょっとした事情でファミコンソフトの「将棋 竜王戦」を入手したので、第25回選手権バージョンのGA将と対局させてみました。 手合割:平手 先手:Gasyou8_8.0.35e 後手:かなた先生 手数----指手---------消費時間-- 1 2六歩(27) (00:09 / 00:00:09) 2 5…

GPW杯5五将棋大会2016で優勝しました

http://minerva.cs.uec.ac.jp/~uec55shogi/wiki.cgi?page=GPW%C7%D5%A5%B3%A5%F3%A5%D4%A5%E5%A1%BC%A5%BF%A3%B5%B8%DE%BE%AD%B4%FD%C2%E7%B2%F12016 私は現地に行けなかったので、芝浦工業大学 五十嵐研の原さんに代理操作して頂きました。感謝感謝。 参加…

PGQ: COMBINING POLICY GRADIENT AND Q-LEARNING

https://arxiv.org/pdf/1611.01626.pdf Deepmindの中の人の論文。方策勾配法とQ学習の組み合わせらしい。

ちょっとだけ強くなった

@MoriokaYuichi 線形近似の場合でも適用できるかわかりませんが、パラメータの出現回数を数えてMBIE-EBによって出現回数のルート分の1相当のボーナスを加えて行動決定するとかいかがでしょうか。応用されてDeepmind社のDQNに使われています。— Katsuki Ohto …