スズメレンダラー・クマ将棋の開発日記

2012-03-13から1日間の記事一覧

駒割の学習

作ったルーチンで、テストで１０００局面の学習を行ってみた。歩を１００に固定。以下は結果。歩=100 香=156 桂=135 銀=176 金=253 角=283 飛=316 と=360 成香=269 成桂=260 成銀=231 馬=393 龍=459「と」が大きいが気になるが、なんとなく、あっていそう…

ペナルティ

微分値が小さな特徴値はゼロの方向に向かうように更新している。頻度が少ない特徴値は微分値が小さくなる傾向にあり、頻度が少ない特徴量は信頼できないものと見なすことになる。

KPPの対称性

KPP＝[王][駒1][駒2]の対称性は２種類ある。一つは、駒1と駒2の対称性で、[王][駒1][駒2]=[王][駒2][駒1]。この対称性でメモリを半分にできる。もうひとつは、左右対称性。９九玉と１九玉の評価値は同じにしている。これは右玉と左玉の区別がつかなくなる…

ボナンザメソッドあれこれ

並列学習ルーチンができたので学習中。探索の並列化は大変だけど、学習の並列化は割と簡単にできた。これにて脱ボナンザライブラリは達成できそう。オリジナルのfv.binを超えるものは作れそうにないですが、今のままだと、クマ将棋は何も特徴がないので …