GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

強化学習の移植中

 Javaで作ったエージェント*1はTD法→Q学習→TD(λ)→Q(λ)と色々アルゴリズムを変えながら拡張していったので、かなりグチャグチャになっていました。

 が、今回C++に移植するにあたって*2ちゃんと整頓したら割と綺麗になりました。

 まぁ、綺麗なのは最初だけで、どうせすぐにドロドログチャグチャになっていくのですが。

 現在の進捗は50%程度。この分だと明日には終わるかも。何とか今週末までに将棋の強化学習を動かし始めたいです。

*1:学習を行う主体。将棋のプレイヤーみたいなもの。

*2:将棋関係のライブラリはC++なので。