【将棋】駒の位置評価の可視化

各マスにおいて、駒がある時と、ない時の位置評価値の差を表示してみました。

上がbona6.0、下が現状のクマです。
青い程、先手に有利で、赤いほど後手が有利。
なんとなく傾向は似ている感じはある。
bona6.0では後手の8一の飛車は、あまり良い位置では
ないことが分かります。
また、7六の歩が効いていることが分かります。

【将棋】オンライン学習中

所謂、激指メソッド?で学習中です。平均化のやり方はよく分からないので省いています。
並列化していないのですが、深さ3の5000局で一日半で終わります。
去年はボナメソで並列化して1週間くらい学習した後にバグを見つける・・・の
繰り返しで、結局2〜3カ月かかってしまい、非常につらかったのですが、
激メソだとかなり開発が楽になりました。

オンライン学習のポイントは、学習させる順番で結果が大きく依存してしまうので
■学習局面をランダムにシャッフルさせて偏りをなくすこと、
■指手も全手生成せず、ランダムに20手くらい生成する(正解手は必ず生成)こと
■あと、終盤は1手が命取りになるので、終盤ほどマージンを大きくする
という感じでしょうか。

kuma_test_lという名前でfloodgateに流しています。
まだ弱いですが、じわじわ強くなっている気がします。
途中結果は以下のような感じです(phpスクリプト組みました)。
KKPの結果です。参考にbona6.0の評価値も載せています。

金の評価値


飛車の評価値

なかなか面白いです。
なんとなく傾向は似ているので、それなりに学習はうまくいっているかと。
勝手に矢倉や穴熊も組んでくれるし。
全体的に絶対値が低いのは、学習回数が足らないせいです。
このため、相手玉の離れた位置に余計なと金を作って、
終盤にあっという間に負けるようです。

再起動後

うまく起動できたが、最初に指定したログイン名でログインできない。
リカバリーモードで、rootでログインしてpasswdとかadduserで追加。
リカバリーモードはオプションで「ro」→「rw」として、ファイル書き込み可能にしておく。

LANのデバイスドライバのインストール

tg3.koをmakeでビルド。insmod tg3.koでインストールすると、ようやくネットにつながった。

RAIDの確認

cat /proc/mdstat
で[2/2]となっていたらOKらしい。

メモ: mac mini serverにubutntu 12.04をインストール

ハードディスクが2台入っているので、どうせならRAIDを組みたいということで
RAID1+ubuntuでインストールした。rEFIt入れてMac OSとデュアルで入っている。

うろ覚えでメモ。


最初の失敗例:
ubuntu desktopのインストーラではRAIDはできない
■あとからRAIDを入れるのは困難。インストール時に導入したい。
ubuntu serverのインストーラではネットワーク接続が必要。
 インストール時にmac miniNICを認識しないので、できなかった。


ということで、ubuntu alternativeのCDでインストールしたらできた。

起動時

・expert install modeを選択
・noapicオプションをつけないと落ちる。

パーティション

手動で行う。
2台のハードディスク(hdaとhdb)で同じサイズのパーティションを確保。
・種類は両方ともraidとする。
・それとは別にスワップ領域を適当に確保


パーティションを切った後、メニューでソフトウェアRAIDの設定を選択。
RAID1として、前記のhdaとhdbのパーティションを選択。


すると、新たなraidパーティションが現れる。
これを選択して、ext4にして、マウントポイントを/とする。

パッケージのインストール

途中でネットワークがどうのこうの出てきても、接続できないので、「いいえ」とする。
そのあと、どんなパッケージをインストールしますか?みたいな問い合わせが来るので
全部チェック(ubuntu desktopとか)

これを入れないと、本当に必要最小限のシステムしか入らないので詰まった(gccすら入っていなかった)。
でも、この問い合わせが出るときと出ないときがあった。

grubのインストール

/dev/hdaと/dev/hdbにインストール。
このとき、致命的なエラーと出るときがあったが、出ないときもある。

メモ:mac miniにubuntu12.04 desktopをインストール

mac mini server(2.3GHzクアッドコアIntel Core i7)にubuntu 12.04 desktopをインストールできたのでメモ。

mac OS
パーティションを分ける
・rEFItのインストール
・USBメモリにubuntu12.04 64bitのイメージをコピー

1.再起動
2.USBをもったペンギンがrEFItで出てくるので選択
3.install ubuntuを選ぶ
 そのままだとkernel panicになるので、tabキーを押して、noapicをつけて起動
4.インストールが進む
5.最後の最後でgrubが失敗したと出てくる。

1〜5をもう一度、行うと今度はちゃんとインストールが完了した。

・再起動
・HDDをもったペンギンがrEFItで出てくるので選択
ubuntuを起動
 またkernel panicになるので、eキーを押して、noapicをつけて起動
・起動したら、/etc/default/grub のオプションに noapicを追加
 これで毎回、noapicを指定する必要がなくなる

・マウスが認識しなくなる。USBを抜いて、また指すと直った。

・有線・無線LANを認識しない
 有線LANのドライバー(tg3-3.105h.tar.gz)をUSBにダウンロードしてコピー。
makeでドライバを作成後、sudo insmod tg3.ko, sudo make install。

・無線LANは相変わらず認識しない

1手詰の効果

1手詰有 vs.1手詰無 持時間8分×100試合にて、
1手詰有が61勝-37敗-2分。
勝率62%でレーティング差にすると75くらい。
NPSは×0.8くらいになってしまうけど、特に詰めが絡む終盤で強い。
1手詰無だと深さ8で評価値800くらいの局面で、
1手詰有だと同じ深さ8で評価値1800くらいになったりする。
という訳で1手詰は入れた方が良さそう。