13/04/24 13:12:11.20 OUbif6fU
ソフトが入玉に弱いのは、2つの原因がありそう。
1つは棋譜が少ないために、自陣から出てからの玉位置をまともに評価できないこと。
Bonanzaの保木さんもそう言ってるね。
>学習に使用したプロ棋士の棋譜 45833 局です。入玉模様の棋譜は1000局以下
>だと思います。入玉の局面を Bonanza は殆ど評価することが出来ません。
URLリンク(d.hatena.ne.jp)
2つ目は第四局で起きた相入玉の場面。プエラが「と金製造機」に変わった。
保木モデルはロジスティック回帰によるパラメータ推定のようなので(推定に一か月ぐらいかかるらしい)
その基本にある確率法則はベルヌーイ事象つまり「成功」か「失敗」か。
持将棋のようなどちらでもない事象は考慮外。
だから「詰め」という目標が消失した時、評価値は駒の得点しか稼ぐところが無くなって、
一番評価の低い「歩」をかなり評価の高い「と金」に変えようとする。
相入玉の評価関数を作るには、持将棋も含めた事象化が必要で、
それには新しく統計モデルから定式化して行く必要がある。
これは専門知識が必要で限られた人しかできない。データも少ないのでかなりの難関