GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2017-03-01から1ヶ月間の記事一覧

カーネル法による構造データの解析

http://www.geocities.co.jp/kashi_pong/publication/PRMUslide.pdf 将棋の駒組みは有向グラフとして表せるから、それを何とか評価関数に落とし込めないかと思っていたんですが、この手法なら行ける…かも。 基本的には「有向グラフを、任意ノードから始めて…

Online Learning Rate Adaptation with Hypergradient Descent

https://arxiv.org/abs/1703.04782 直前の勾配と現在の勾配の関係から、学習率を自動調整するらしい。

Evolution Strategies as a Scalable Alternative to Reinforcement Learning

https://arxiv.org/abs/1703.03864 ひょっとして、GA将のGAが復活する、かも!?

Google/DeepMind先生がまたやらかしたらしい

Google、人間のように学習を積み上げるAIを開発 - PC Watch 原論文はまだ探してないですが、コンピュータ将棋の学習に応用出来そうな気もしますし、不要な気もします。 要するに「パックマンの学習後にPongの学習をしても、パックマンの知識が残るよ」って話…