2007-10-31 強化学習の移植中 開発日記 Javaで作ったエージェント*1はTD法→Q学習→TD(λ)→Q(λ)と色々アルゴリズムを変えながら拡張していったので、かなりグチャグチャになっていました。 が、今回C++に移植するにあたって*2ちゃんと整頓したら割と綺麗になりました。 まぁ、綺麗なのは最初だけで、どうせすぐにドロドログチャグチャになっていくのですが。 現在の進捗は50%程度。この分だと明日には終わるかも。何とか今週末までに将棋の強化学習を動かし始めたいです。 *1:学習を行う主体。将棋のプレイヤーみたいなもの。 *2:将棋関係のライブラリはC++なので。