楽観的合議

そこで、文殊でも採用している楽観的合議を使ってみることにした。これは、単純に各クライアントの最善手の中で最も評価が高い手を採用する方法。たしかに楽観的すぎる気がするが、なんか良い気がしてきた。でも、これも戦わせてみるが、強くなっているか…

2012-02-27

重みの制約付き最適化

そこで、重みをＧＡで求める際に、最善手の重みが最も高くなるように制約をつけた。すると、１クライアントでは３８％くらいの一致率が４０％くらいに若干増えた。合議vs非合議で戦わせてみるが、強くなっているか弱くなっているか良く分からなかった。あ…

2012-02-27

次善手・次々善手の重み付き投票

最初に試したのが、最善手だけではなく、次善手、次々善手を求めて、それぞれに重みをつけて投票するやりかた。重みは一致率が高くなるようにＧＡで最適化。これで一致率が７０％と驚愕の数値（バグかと思った。でも実はバグかもしれない）がでたので喜ん…

2012-02-27

【将棋】合議のテスト中

４つのクライアントで合議をやると弱くなっているようなので、まだfloodgateに投入していません。いろいろな合議の方法を試しています。

2012-02-26

【将棋】オーダリングメモ

忘れないうちにクマ将棋のオーダリング順序メモ。以下の順序でオーダリング。具体的には手に点数をつけて、std::sortでまとめて並び替え。逐次生成しておらず（ビットボードではないので難しい）、ソートに時間がかかりそうなので、１番良い手と２番目に…

2012-02-23

【将棋】合議の実装

合議の実装が大体終了。並列探索を行うには、局面構造を変えないといけないし、（今のクマ将棋は探索局面とハッシュをstaticに持っている）マルチスレッド処理の方法がよく分からし、そもそも並列探索自体がとても大変そうなので実装が簡単そうな合議に…

2012-02-20

KPP評価部分

以下のようにして、listを作成した後、例のlist加算で評価できます。（ボナンザのソースを見たことがある方はピンとくると思います） for(pos = 0;pos < 81;pos++) { koma = in.kifu[pos];// 駒種 switch(koma) { case KOMA_FU:// 先手歩 // KKP加算 ret =…

2012-02-20

三角テーブルから正方テーブルに変換

#define PcPcOnSq2(k,i,j) pc_on_sq2[k][i * fe_end + j] // KPPテーブルを三角テーブルから正方テーブルに変換 for(k = 0;k < 81;k++) { for(i = 0;i < fe_end;i++) { for(j = 0;j < fe_end;j++) { if(j <= i) { PcPcOnSq2(k, i, j) = PcPcOnSq(k, i, j); }…

2012-02-20

【将棋】配列版でＫＰＰを使う方法

ボナンザの３駒関係（ＫＰＰ）を配列版で使う方法です。ビットボードで使う場合はボナンザのコードをそのまま使えば良かったのですが、れさぴょんやsimkのような盤面を配列で管理している場合は、コードがそのまま使えないので苦労します。というのは、オ…

2012-02-12

■

いくつかブログに解説されていました。ありがとうございます。僕は将棋を指せないので情勢の判断がつかないのですが、まったくのでたらめという訳でなく、 Sunfish戦では序盤で相手飛車が困っていたようです。 http://shingoozisann.blog48.fc2.com/blog-en…

2012-02-12

オープン戦参加

第17回コンピュータ将棋オープン戦にクマ将棋で参加しました。過去のオープン戦をみると、結構参加されていたので、今回参加しましたが、 SunfishとＧＰＳ将棋とクマ将棋の３つだけでした・・・クマ将棋は学習途中のfv.binを使いました。将棋所を使っての…

2012-02-11

結果

これで、一応、矢倉ぽく組むようになりました。あと、１万局より４万局で学習させた方が強くなった気がします。 floodgateにsimk_kpp_100で流していますが、当然ながらオリジナルfv.binを使ったバージョン(simk)よりもかなり弱いです。プロの棋譜だけでは…

2012-02-11

ボナンザのコンパイル&実行

gcc+linux環境では以下のようにしたら動きました。 >gcc *.c -c -O3 >rm learn1.o >gcc learn1.c *.o -O3 -lm -lpthread >./a.out ボナンザのコマンドラインが立ち上がるので、６コアマシンの場合は >learn ini 32 -1 -1 6 6 とすれば６並列で学習が始ります…

2012-02-11

学習データ

学習にはrecords.csaというcsa形式のデータが必要です。これを準備します。ボナンザはプロ棋譜３万＋将棋クラブ３万（２４万局のデータは６０００円くらいで売っている模様）のデータを学習させたらしいけど、手元にないので、2chkifu.csaというもので学習…

2012-02-11

shogi.hの変更

まず、shogi.hに以下を追加。 #define TLP #define NDEBUG #define exam_bb(a) a TLPを定義すると、学習時にマルチスレッドで並列処理できるようです。あと、NDEBUGを定義しないと、学習時にassertに引っかかったので。 exam_bbは局面に間違いがないかチェ…