GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

今日やった分を反映

  • 将棋関連
    • TDLeaf(λ)
    • 評価関数に特徴を追加
      • 駒の種類・筋ごとの評価
      • 駒の種類・段ごとの評価
      • 駒の種類とその駒に利いている自分 or 相手の利きの数の評価
      • 駒の種類・移動可能なマスの数(自由度)の評価
    • 将棋のルールの細かい部分の実装
      • 千日手・連続王手の千日手の検出
      • 入玉宣言の実装
      • 詰みとステイルメイトの区別
      • 打ち歩詰めと打ち歩ステイルメイトの検出
    • 他のソフトとの連続対戦(勝率での検証用)
    • ニューロ評価関数
      • 予備実験
      • C++ on x64で実装
      • 線形評価関数を教師としての学習
      • CUDAに移植
    • 並列化
    • メタ強化学習C++への移植
    • 【保留】詰め将棋の実装

詰め将棋はABC探索を使えば、それなりに簡単な実装でそこそこ性能出ないかと考えています。

ABC探索と言っても、singular marginを無限大にして親ノードの全兄弟手が共謀深さに寄与する様にすれば、ある程度処理は省けますし。

でもこれ、劣化df-pnって言われそうな実装ですね。ちゃんとしないとABC探索が泣く。