GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

ポーカーの最強プログラムが出来たらしい

ねとらぼ @itm_nlab
人工知能の歴史にまた1ページ

テキサスホールデム(ポーカー)の必勝プログラムが完成 ついに不完全情報ゲームでもコンピュータが人間を上回る - ねとらぼ http://nlab.itmedia.co.jp/nl/articles/1501/09/news108.html … @itm_nlabから

https://twitter.com/itm_nlab/status/553449457535033344?lang=ja

kmo2 ‏@kmo2
CFR=「あの時ああしていれば!という後悔を最小化するアルゴリズム」 / “テキサスホールデムの最適解は求まるか | Scene Research Station” http://htn.to/XDC9RdFi4

https://twitter.com/kmo2/status/553453158937018368?lang=ja

ぷるたん ‏@purutan2000
ポーカー解いたとかいう論文読んでみてるけど「すっごいマシンでCFRやったよ!」って書いてあるようにしか見えない。そりゃ非常に強くはなるだろうが解いたわけじゃないじゃん。

https://twitter.com/purutan2000/status/553455783233339392?lang=ja

 一つ目と二つ目のツイートのリンク先が詳しく解説していますので、詳細はそちらで。

 ものすっごく大雑把に書くと、合計4000コアのCPUを2ヶ月間ぶん回してCFR+というアルゴリズムで学習させた結果、ポーカの一種を「解明した」と主張しているらしいです。

 まぁ、本当に解明したのかもの凄く強くなった「だけ」かは原論文に当たってみますが、面白そうな話ではあります。

 んで、以下備忘録。

 まずCFRの提案論文 → http://poker.cs.ualberta.ca/publications/NIPS07-cfr.pdf

 今回の論文 → http://www.sciencemag.org/content/347/6218/145.abstract

 論文読み終わったら続報を書くかもです。