08/08/07 02:53:31
>>398
評価関数が正確なら1手読みで十分だけれど、
逆に、
局面が最後まで読めるのなら
評価関数は石数を数えるだけで良いと考えると
読みの深さを増やすほど強くなりそうなことがわかる
だから、評価関数を正確にすることだけではなく
計算速度が速い評価関数が使われてるんだ。
>今はパターンの重みを決める時とかは、結果的にそのパターンが現れた時の
>最終的な石差の平均値に収束するように決めてるでしょ?
評価にMinimaxが使われているのだから、
評価関数のスコアも平均値ではなくて、
自分、相手が共に評価関数の決める最善手を指したときのスコアに
近づくようになってると思う。
だから
>パターンAは50%は大負けで50%は大勝だとすると
>普通に学習させるとこのパターンは勝ち負けに影響しないと判断されて重みは0になる。
>10%は僅差負けで90%は大勝のパターンBと100%僅差勝ちのパターンCでは、
>10%は僅差で負けるパターンBの重みの方が大きくなるのが普通だよね?
こんな風に勝率で評価関数を決めていないと思うんだが。
もし、そのやり方に沿って決めるなら
Minimax法が使えなさそう。