【オセロ,将棋】ボードゲーム【囲碁,War】 at GAMEDEV【オセロ,将棋】ボードゲーム【囲碁,War】 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト784:310 17/04/02 18:48:15.03 xuvwd7i8.net 別のオープニングを試したところ、F5F6系や、F5D6C4G5系はZebraに勝てません。 試しにF5D6C4G5系を調べてみたところ、ツリー展開がなかなか深まらない様子で、 有望と評価される分岐が多すぎるのかと思います。最後はやけになって、1分読み +要所でバックグラウンド放置探索で無理やりツリーを伸ばしたところ、途中経過で Zebra評価値が-4まで行ったところから何と+4まで回復しました。 やはりポイントはツリーの深さであり、余計な枝を探索しない、ポリシーネットの精度 が重要になると。多分。 あと、相手パスの時にもおかしくなるバグを発見。今夜は、ここを調査。 785:310 17/04/03 20:36:38.16 BqB2rFYT.net パスがおかしくなる奴は、やはりデバッグルーチン限定で、かつ直すと本処理にも 大きな修正が必要になるので、当該デバッグ処理を削除して対処。 F5D6C4G5系をテストプレイしていてわかったのは、中盤ことごとく読みがZebraと 一致しない事。一致しないだけなら良いけど、そこがところどころ悪手になってるっぽい。 読みが一致しないと、事前に読んでいない枝で探索する事になり、浅い探索のまま 間違いが連鎖する感じ。Zebraの着手は、こちらAIが予想は評価値順で3番目以降に なっている。 これ、ロールポリシーが決めるプレイアウト割り当ての優先順位の問題か、それとも プレイアウトの精度の問題か、はっきりしませんが、要するに評価値が間違っている =弱いという事ですね。 で、この2点について、もう1ステップ先に進んでみようかと思います。 プレイアウトについては、強化学習で良いヒューリスティックを作れないか検討。 ロールポリシーについては、与えている棋譜のバラつきが原因かも知れないので、 強化学習の棋譜から自動生成する事を検討。 あと、終盤40手以降はほぼ間違えないので、Solverを削除してしまいました。 また、できれば、最終的には定石も無しにしたくなって来ました。 目指せピュアMCTS。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch