【オセロ,将棋】ボードゲーム【囲碁,War】 at GAMEDEV【オセロ,将棋】ボードゲーム【囲碁,War】 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト733:310 17/02/15 23:06:48.81 DozmM7Z3.net 色々細かく改造。やっぱライブラリがあると気が楽です(汗 簡単なネットワークの初期の学習の具合では正答率50%くらいが上限な印象だったので、 ネットワークを複雑にしてみました。で、1エポック8時間以上かなぁ。 もっとハードを・・・って真剣に思いますorz 734:名前は開発中のものです。 17/02/17 23:21:12.85 ZDoCs64T.net AMDが今度発売するcpuが結構いいかもしれない 735:310 17/02/19 20:31:51.68 PM1ZzNLK.net DCNNで学習させてるのですが、あまりに時間がかかるので、裏でもう一度 アルファ碁の論文を。日本語解説ページがいくつかできていて助かります。 で、読んでいたら、ロールアウトポリシーなる線形Softmaxでプレイアウトの 手を選択していると・・・。つまりはオセロ評価関数のような特徴を渡して、線形 回帰の代わりに出力をSoftmaxで確率分布にしたものです。 ロールアウトポリシーは棋譜との一致率が25%程度だけど、計算が圧倒的 に速く、このばらけ具合がちょうど良いとの事。 むむむ。アルファ碁はプレイアウトの手の選択にDCNN使ってないのねorz 日本語解説のおかげで、MCTS部の構造もようやくわかった。 いくらマシンが早くても無理だろと思っていた計算も、これなら何とかなりそう レベルの構造に落とし込まれていて、納得しました。 でも、実はまだインプットに何を食わせているのかが、よくわからない(汗 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch