【オセロ,将棋】ボードゲーム Part2【囲碁,War】 at GAMEDEV【オセロ,将棋】ボードゲーム Part2【囲碁,War】 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト141:535 17/12/09 20:29:04.06 L/Fjd2gI.net 酷いバグ発見w 8近傍求める関数間違ってたw 142:名前は開発中のものです。 17/12/09 21:36:39.83 L/Fjd2gI.net ロールアウトの着手確率いじったら黒番の勝率5%だと…? 何が起こってるんだ… 143:535 17/12/09 22:53:03.29 L/Fjd2gI.net 着手不能点を着手候補にしてたw だからか。 144:535 17/12/10 21:26:16.30 ecwKDJmF.net 局所解に落ち込むとなかなか抜け出せないのでUCB1のバイアス係数を思いっきり上げてみた。 これで局所解抜けてくれればいいが… 145:310 17/12/10 22:11:20.32 3vDAj4sl.net MLP版の評価関数がNaN地獄 146:に落ちてた。 何回かやり直したけど、結構簡単にNaN地獄に落ちるので、一旦仕切り直しで、 線形回帰な評価関数に注力する事にしました。 MCTSでテストすると、途中まで割と見知ったオープニングになってきているけど、 評価値自体はあんまり安定していない感じ。まあ、相対関係があっていれば、 絶対値はずれていても関係ないといえば関係ないけど。 しばらく強化学習を続けながら、ちっと別な事を考えてみます。 というか、Alpha Zeroの強化学習の回数が、思ったより少ないなぁと思ったけど、 自分がこれまでにやった回数を概算で考えてみたら、桁が2~3くらい少なかったorz やっぱマシンパワーは正義だなぁ。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch