【オセロ,将棋】ボードゲーム【囲碁,War】 at GAMEDEV【オセロ,将棋】ボードゲーム【囲碁,War】 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト322:310 15/09/03 10:19:29.05 Fd8XT4rV.net 色々と失礼しました。 もう一度、よーく上記pdfを読み返していたところ、原因らしきものが見つかりました。 記載にあいまいというか、ちょっとおかしいところがあって、式の変形をしっかり追って 確認すれば良かったのですが、思い込みで解釈をして変な計算をしていました。 そこをとりあえずざっと修正したところ、遅々としつつも収束に向かっている模様ですが、 まだまだ完全ではないようです。ある程度二乗誤差が減ったところで、また増え始めたり しています。正規化も試したけど、やはり同じ。 もう少し、検討してみます。 323:310 15/09/03 10:38:17.33 Fd8XT4rV.net >>320 もともとひっくり返しあった後の終局を予測するのが目的なので、教師データは最終局面 の石差です。盤面の特徴(パターン)から、最終石差を予想するための重回帰計算なので、 その時点の石数は、説明変数に入れてません。なので、パターンの選択が適切なら、 最善手の応酬において1手毎にどれだけ石数が入れ替わろうと、影響を受けずに、 二乗誤差が終局に近づくほど減っていくと予想されます。 というか、そうなるように説明変数であるところのパターンを模索していくと理解しています。 手元にあるwzebraなんかは、評価値と称して最終石差予想が表示されているのですが、 やはり、ある程度の誤差を含みつつも、大きくぶれているようには見えません。 評価関数の使い道を考えると、実は絶対値はそれほど重要ではありません。 中盤探索のn手読みの時の盤面評価と、ムーブオーダリングに使うので、ある局面から 派生したn手先の局面における相対的な関係が保たれていればOKです。 また、MTD(f)法などを使う時の、fの初期値設定にも使います。この時は絶対値で正確な 方が良いはずですが、外れはすぐにカットされて次に行くので、トータルの時間に対する 影響は小さいように感じます。 とはいえ、相対的な関係が保たれているのかをチェックするのは難しいですから、 結局のところ出来上がった評価関数の評価は、教師データとの二乗誤差の小ささに するしかないかなと。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch