【オセロ,将棋】ボードゲーム Part3【囲碁,War】at GAMEDEV【オセロ,将棋】ボードゲーム Part3【囲碁,War】 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト122:535 20/02/21 21:02:31 /4d3LiPl.net やっぱ素のモンテカルロに勝てない!!! どうしてなんだ… 123:535 20/02/21 22:56:34.67 /4d3LiPl.net 単に白番有利説が急浮上www 124:535 20/02/22 00:47:13.32 j5uEDLd9.net いや、ちがうっぽい。 うーん。 125:535 20/02/22 17:03:42.93 j5uEDLd9.net キター!素のモンテカルロに勝ち越しました! 黒番 31勝20敗 白番 32勝19敗 126:535 20/02/22 20:31:10 j5uEDLd9.net モンテカルロが間違える局面で間違いを訂正してそれをDNNに学習させる方法ないかなぁ 127:310 20/02/22 21:32:51.12 wHsEFeMN.net 間違える局面が特定できているて、間違えた手を訂正できるんなら、 訂正後から対戦再開させて、その棋譜で局面DB更新して、学習するとか。 特定できていなくても、基本強化学習は、対戦→DB更新&学習の 繰り返しで、徐々に間違いを訂正していく方法。もうちょっと工夫する ならε-Greedyなどの手法で既存の棋譜の途中で無理やり別の手に 分岐させていく。その手が悪くても、「悪い手である」という認識を学習 させる事ができる。 線形計画だとモデルが上手くできていないと学習が飽和しちゃうけど、 DNNだったらある程度うまく学習してくれるかも。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch