btest、ktest

floodgateにbtestとktestというやつを流してます。
中身はクマ将棋なんですが、
btestはbona6.0のfv.binを初期値に現役棋士同士の対局を学習させたもので、
ktestは特徴(玉周りの金銀枚数など)を追加してゼロから学習したバージョンです。
btestはバグもあったけど、たぶんR2600いかないくらいだと思います。
クマ将棋はビットボードも使っていなくて(25万NPSくらいで遅い)、3手詰も入れていないですが
探索にバグがなくて(重要)、評価関数が優れていると、
これぐらいのレーティングは出るよ、という参考になると思います・・・。

fv.binを初期値にすると、若干の読筋は変わるけど、ほとんどbona6.0と同じになりました。
これじゃつまらないのでゼロから学習してます。ktestがこのバージョンでR2200くらい。
学習局面に似た局面だと強いのか、たまに中堅どころに一発入ったりするようですが、
序盤で失敗すると評価値も変(相手が1000点くらいなのに、自分は0点くらい)で
ボロボロで弱いです。
3駒関係は次元数が大きすぎるので、学習局面と似た局面が出てくると強いけど、
それ以外が出てくると駄目なのかもしれません。
(終盤で差がついてくると、ktestもbtestもどちらも直線で読筋も似たような感じになるようです)
玉が上がってもダメですね。確か、ボナンザは入玉形も4万局入れてたような。
いまは2万局なので、もっと沢山の棋譜を使った方がいいのかもしれない。
相対の2駒とかだと、少ない棋譜でも、割とどんな局面でも強いかもしれない。
とにかく、時間もないので学習の更新ステップ数を512とかにしてます。