【オセロ,将棋】ボードゲーム Part2【囲碁,War】 at GAMEDEV【オセロ,将棋】ボードゲーム Part2【囲碁,War】 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト83:535 17/11/15 00:08:07.85 hR/pxKTk.net 丸一日回してみました。 1000局くらい軽くいくだろうと思ってたけど意外と時間かかってますね。 これはこの辺にしておきます。 533局目 黒(airandom.dll)の勝利回数: 175 白(ai-lv2.dll)の勝利回数: 358 475局目 黒(ai-lv2.dll)の勝利回数: 407 白(airandom.dll)の勝利回数: 68 450局目 黒(airandom.dll)の勝利回数: 198 白(ai-lv1.dll)の勝利回数: 252 365局目 黒(ai-lv1.dll)の勝利回数: 252 白(airandom.dll)の勝利回数: 113 84:310 17/11/17 23:19:33.73 0nQ3gtJu.net 浅い探索付き強化学習は結構有効に機能しているようです。 学習の速度が明らかに上がったし、精度も良くなっているようで、テスト盤面の 誤差が結構減りました。ただ、そろそろ飽和したか、局所解に入ったような印象。 で、色々考えたあげく、線形回帰ではこの辺が限界かもしれないという事で、 評価関数をmlpにしてみました。valueの方がうまく学習しなかったので、回帰型 ではなくsigmoid出力にして0~1の数字を石差に変換かけてます。 強化学習は、回帰版の評価関数の結果をそのまま利用してます。 そろそろそこそこ使えそうな誤差になってきたようだし、強化学習は自分に対して 行った方が良いはずなので、全面的にmlpに移行しちゃおうか悩み中。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch