【オセロ,将棋】ボードゲーム【囲碁,War】

【オセロ,将棋】ボードゲーム【囲碁,War】 at GAMEDEV

【オセロ,将棋】ボードゲーム【囲碁,War】 - 暇つぶし2ch■コピペモード
□スレを通常表示
□オプションモード
□このｽﾚｯﾄﾞのURL
■項目テキスト

748:535
 17/03/02 19:55:15.50 ejFPCGdH.net
がっつり連続対戦中。黒番対LV２だけ流し終わった。 
 
100局目 
黒(airandom.dll)の勝利回数:     73 
白(ai-lv2.dll)の勝利回数:       27 
 
なお他のレベルも平行して回してるけどいま黒番対LV3に1勝54敗中ｗ 
 
なんでこんなに差がでるのかなぁ。

749:535
 17/03/02 20:08:53.54 ejFPCGdH.net
対ＬＶ２はかなり同じパターンで勝ってるな。 
勝利手順ＤＢにずっぽり嵌ってくれてる感じだ。 
ＬＶ３は嵌ってくれない。

750:535
 17/03/02 21:41:10.44 ejFPCGdH.net
序盤用ＤＢはそこそこうまく動いているが 
中盤～終盤用のＤＢのせいで致命的に打ち手が狂ってるように見える。 
ＬＶ３に勝てないのは多分これだな。

751:535
 17/03/02 23:28:08.02 ejFPCGdH.net
ずいぶん昔に書いたコードにバグがあった。 
ビビるくらい致命的な奴。 
よく今まで動いてたな。

752:310
 17/03/03 01:05:23.13 0ijSS6CX.net
次の１手もDCNNもなんか上手くいかないので、アルファ碁の原点に戻りました。 
アルファ碁のMTCSとしての特徴は、各ノードで評価関数を動かして、そのノードに 
点をつけて勝率と５０％混合する事で、ノードの選択に事前に差をつけてしまう事に 
あります。これによって、負けが多いけど１手だけ良い手があるルートを正しく評価 
する可能性を高めていると解釈しています。 
 
で、評価関数はオセロでは線形和で確立されているので、昔の奴をと思ったのですが、 
どうせならMLPのライブラリ使ってしまえばEigenが使えるので信頼性高い上に、学習 
率の最適化でモーメンタムどころかSMORMS3が使えるようになります。インプットが 
とても疎なので、EigenのSparseMatrixを使って高速化を図ります。 
 
早速作って学習させてみたところ…僕の記憶が確かなら以前のプログラムの数十倍 
くらいの速度で動いています（汗。これなら１００エポックくらい楽勝。 
 
今は評価値を計算させていますが、一旦できたら、次のステップで勝率を計算させられ 
ないかなぁと。ただ、評価値がある程度正確なら、勝率ではなく平均スコアでプレイアウト 
しても良いのかなと思っています。

次ページ