2012-03-13から1日間の記事一覧

駒割の学習

作ったルーチンで、テストで1000局面の学習を行ってみた。 歩を100に固定。以下は結果。 歩=100 香=156 桂=135 銀=176 金=253 角=283 飛=316 と=360 成香=269 成桂=260 成銀=231 馬=393 龍=459「と」が大きいが気になるが、なんとなく、あっていそう…

ペナルティ

微分値が小さな特徴値はゼロの方向に向かうように更新している。 頻度が少ない特徴値は微分値が小さくなる傾向にあり、 頻度が少ない特徴量は信頼できないものと見なすことになる。

KPPの対称性

KPP=[王][駒1][駒2]の対称性は2種類ある。 一つは、駒1と駒2の対称性で、[王][駒1][駒2]=[王][駒2][駒1]。 この対称性でメモリを半分にできる。もうひとつは、左右対称性。9九玉と1九玉の評価値は同じにしている。 これは右玉と左玉の区別がつかなくなる…

ボナンザメソッドあれこれ

並列学習ルーチンができたので学習中。 探索の並列化は大変だけど、学習の並列化は割と簡単にできた。 これにて脱ボナンザライブラリは達成できそう。 オリジナルのfv.binを超えるものは作れそうにないですが、 今のままだと、クマ将棋は何も特徴がないので …