【オセロ,将棋】ボードゲーム【囲碁,War】 at GAMEDEV【オセロ,将棋】ボードゲーム【囲碁,War】 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト748:535 17/03/02 19:55:15.50 ejFPCGdH.net がっつり連続対戦中。黒番対LV2だけ流し終わった。 100局目 黒(airandom.dll)の勝利回数: 73 白(ai-lv2.dll)の勝利回数: 27 なお他のレベルも平行して回してるけどいま黒番対LV3に1勝54敗中w なんでこんなに差がでるのかなぁ。 749:535 17/03/02 20:08:53.54 ejFPCGdH.net 対LV2はかなり同じパターンで勝ってるな。 勝利手順DBにずっぽり嵌ってくれてる感じだ。 LV3は嵌ってくれない。 750:535 17/03/02 21:41:10.44 ejFPCGdH.net 序盤用DBはそこそこうまく動いているが 中盤~終盤用のDBのせいで致命的に打ち手が狂ってるように見える。 LV3に勝てないのは多分これだな。 751:535 17/03/02 23:28:08.02 ejFPCGdH.net ずいぶん昔に書いたコードにバグがあった。 ビビるくらい致命的な奴。 よく今まで動いてたな。 752:310 17/03/03 01:05:23.13 0ijSS6CX.net 次の1手もDCNNもなんか上手くいかないので、アルファ碁の原点に戻りました。 アルファ碁のMTCSとしての特徴は、各ノードで評価関数を動かして、そのノードに 点をつけて勝率と50%混合する事で、ノードの選択に事前に差をつけてしまう事に あります。これによって、負けが多いけど1手だけ良い手があるルートを正しく評価 する可能性を高めていると解釈しています。 で、評価関数はオセロでは線形和で確立されているので、昔の奴をと思ったのですが、 どうせならMLPのライブラリ使ってしまえばEigenが使えるので信頼性高い上に、学習 率の最適化でモーメンタムどころかSMORMS3が使えるようになります。インプットが とても疎なので、EigenのSparseMatrixを使って高速化を図ります。 早速作って学習させてみたところ…僕の記憶が確かなら以前のプログラムの数十倍 くらいの速度で動いています(汗。これなら100エポックくらい楽勝。 今は評価値を計算させていますが、一旦できたら、次のステップで勝率を計算させられ ないかなぁと。ただ、評価値がある程度正確なら、勝率ではなく平均スコアでプレイアウト しても良いのかなと思っています。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch